这届AI厂家，同质下同焦虑

2024-07-24 03:30 200 阅读 0 评论 132 点赞

声明：本文来自于微信公众号科技新知（ID：kejixinzhi），作者：王思原，授权热心网友转载发布。

这届WAIC世界人工智能大会上，每家AI企业似乎都找了自己的PMF（产品市场契合点）。

2023年是国产大模型元年，腾讯、字节、百度等众多大模型进入市场，正式开启对外服务，月之暗面、智谱AI等创业公司也形成“五小虎”的格局。迭代发展一年后，大模型选手们都已走向台前，给了AI行业更多的机会和答案。

不同于去年大模型的“重在参与”，今年WAIC的重头戏聚焦在更实际的应用、更颠覆性的技术和更普惠的模型。简单来说，往年 WAIC 上厂商们是大模型性能展示和比拼，如今更聚焦的向行业展示实际的最新落地成果和应用方向，比的是大模型落地能力。

从百度、阿里、腾讯，到商汤、智谱、百川、Minimax，从参数到技术，从多模态到端云协同，从价格到应用落地，各家在大模型的方向上似乎愈加清晰，也愈加务实。

而透过本次WAIC大会，一个对于整个行业都较为清晰的信号则是，虽然技术依旧青涩，焦虑也依然存在，但一个个在产业侧落地的AI应用的确在真实地发生，只是聚光灯之外，这些AI加持下的产品应用也没想象中那么亮眼。

Part.1

AI应用“卷上”舞台

如果说去年的WAIC是企业的狂欢，那么今年的WAIC便是用户的狂欢。

从远离用户的模型层面来看，除了字节、月之暗面、零一万物等主要面对C端市场的企业缺席外，其余中国Tier1与Tier2的大模型团队几乎全部到场展出，包括BAT、智谱AI、面壁智能、百川智能、阶跃星辰等等;但除此之外，会内会外也再无新增的中国大模型公司。而WAIC官方披露的的八大“镇馆之宝”中，模型层成果只占1/4。

而应用层，阿里云、华为云、无问芯穹、壁仞、遂原等中国企业不断展出围绕大模型训练与推理的新成果，AI模型在千行百业的应用也呈现愈加井喷之势。

例如阿里不光展示了智能编码助手“通义灵码”，更是通过“通义十二时辰——体验AI助手陪伴的一天”，全方位通义千问大模型背后的对话、效率、智能体、视觉四大核心能力，让用户感知AI助手在生活、学习和工作中的实际作用。此外，钉钉和支付宝在办公以及生活助手场景下，也是阿里AI能力落地上的重要一面。

腾讯的元宝APP覆盖工作提效、生活娱乐两大场景，除了提供AI搜索、AI总结、AI写作等核心功能，还提供创意绘画、口语陪练、百变AI头像等有趣好玩的特色应用，以及更多用户创建的智能体。

商汤展示了可控人物视频生成大模型Vimi，Vimi基于商汤日日新大模型的强大能力，仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

类似提高效率的落地应用还有许多，从金山办公的WPS AI，到智谱AI的数字人直播平台，再到集体亮相的十八金刚人形机器人等等，涵盖医疗、教育、办公等各个场景，并且这些应用不再是概念性的演示，而是已经深入到了各行各业的核心业务流程之中，成为了提高效率、降低成本、创造价值的关键驱动力。

从技术竞赛到应用落地的全面进化，无论是一线科技巨头BAT（百度、阿里巴巴、腾讯），还是智谱AI、百川智能、阶跃星辰、商汤等二线厂商，都将目光投向了AI的实际应用与商业化成果，而非仅仅局限于模型性能的展示。但繁荣的同时，同质化问题也逐渐显露。

Part.2

路线割裂，产品却一致

一个事实是，AI应用的落地要比预想的更快、更深，范围更广，只是从结果上来看，无论是发展逻辑、路线，以及用户对产品的预期都有一定出入。

先说各家商业模式上的路线，百度的CEO李彦宏这段时间，甚至在WAIC现场都还在反复强调，商业化的闭源模型是最能打的;而隔壁的阿里云则是在力挺开源，至于另一家腾讯，则喊着“通用大模型不是模型应用的唯一方向”。

大厂都做不到路线统一，小厂更是五花八门。智谱AI走B端路线，用户群体却是C端;百川智能将企业应用的MaaS化产品作为重点展品;MiniMax同时坚持To B与To C业务并重的发展策略。

研发方向的不同，也意味着各家都有不同的顾虑。例如腾讯，腾讯在大模型上发布上算是慢了一步，但根据腾讯混元大模型负责人刘煜宏最新透露，腾讯内部有接近700个业务接入混元，包括腾讯会议、文档，微信读书的AI助手等，这也使得过去半年腾讯在大模型上的新产品、新版本发布的频率越来越高，这本质是因为不探索原生AI大模型应用，不知道怎么跟业务更好合作。

不过过去一年无论大家走怎样的路径，一年后给到用户的结果十分相似。最简单的就是，在这次大会之前，无数用户可以说是拉满期待，就想看着国内的大厂们，能不能拿出什么点新鲜玩意儿来让大家开开眼。

但结果其实是有些失望。一句话概况就说，即便不去参展，也基本能猜出每个厂商摆出的主要产品是什么。例如百度的基本围绕文心一言做落地，阿里围绕通义千问，智谱AI围绕智谱大模型，从娱乐社交到办公学习，大模型的主要作用十分明显。

看似高大上的落地应用，本质还是集中在各类对话助手、文生图、文生视频产品。行业发展到今天，这些产品的新鲜感早已褪去，以至于现场有观众参展下来表示，每一家的产品都大差不差。

当然，确实也有一些剑走偏锋的落地思路，但仔细来看也只是特定行业特调的，基本也没什么新意。

如果说去年的WAIC让人感觉AI有盼头，大家疯狂期待大厂商们争奇斗艳能卷出哪些五花八门的产品，结果短短一年，齐刷刷地长成了一个模子刻出来的样子。

不过相比BAT这样的大厂可以用大模型服务内部业务生态，以及用内部生态为AI业务输血，快手、B站、阶跃星辰、Minimax、智谱AI这些设计大模型不久的公司算是第一次登场，他们更焦虑于如何站稳脚跟后茁壮成长。

Part.3

中小厂焦虑尽显

这一波AI落地潮，对于中小厂来说并不算友好。

比如，展台紧靠阿里的阶跃星辰，虽然入场虽晚，但极力想挤入“大模型五小虎”的战队中，在营销上试图把格局改变为“六小强”。

在WAIC上发布了三个大模型，其中包括 Step-2:万亿参数的 MoE 模型，目前还需要申请才能体验;Step-1.5V:千亿参数多模态模型，除了图片理解能力提升外，也支持视频理解;Step-1X:图像生成模型，DiT 架构，600M、2B、8B 三种不同的参数量。

不过一个疑问是，靠这三个模型还有出路吗?去年的百模大战造成了社会资源的巨大浪费，尤其是算力浪费，行业不卷模型，卷应用，已经成了共识，没有落地应用已经很难出圈，甚至很难拿到融资。

快手也是今年WAIC上的新面孔，从快手大模型家族来看，其着力点更具有落地属性，重点是通过大模型打开商业化的空间，以及通过视频生成技术给自身的视频业务注入新生机。

这里值得一提的是快手可灵，在文生视频领域上，号称比肩Sora，但目前试用范围依旧无法完全匹配市场需求，即便是快手内部的人想试用都很困难。并且当下使用的结论，是基于内测视频得出，这也就意味着对于可灵的模型能力可能是高估的。更为关键的是虽然目前国内市场尚无对手，但更多的竞争对手正在赶来的路上。

另外一些像智谱AI这些纯AI创业公司，在巨头环绕的市场环境下，需要迫切找到自身的市场定位。以智谱AI为例，尽管在B端市场有所布局，但用户群体的模糊边界使得其在市场定位上面临困惑。企业必须在产品和服务中融入独特的价值主张，以区别于竞争对手，而这在技术趋同的背景下显得尤为困难。

新兴AI企业大多处于初创或成长阶段，资本运作的不确定性增加了财务压力。一方面，高昂的研发成本和市场开拓费用需要持续的资本注入;另一方面，投资者对回报的期待与企业成长周期的矛盾，使得财务规划变得异常复杂。

而做特展的公司，参加一趟WAIC，成本最少也要几十万。对于这些小企业来说，这些钱花出去要“掷地有声”，要么收获订单，要么打响品牌。对于智谱AI，以及云服务厂商等重视企业服务的公司来说，花几十万“买”最终客户资源，性价比并不高。只是展会之后，如何保障对B端用户的继续跟踪及成交，十分考验企业的售后能力。

构建开放的生态系统，与行业伙伴建立合作关系，对于新兴AI企业至关重要。但如何在短时间内建立起有效的生态链，实现资源共享和价值共创，是摆在这些企业面前的现实难题。

一年前，AI行业还在普及大模型的路上，把大模型的概念传播给普通人。而如今AIGC、大模型起码在行业上已经有了广泛的应用，和不错的商业前景。所谓的千篇一律也可以理解为当下行业的最优解，在这个现实与虚拟交互的临界点，现在的平静或许是为了未来的爆发，毕竟在AI时代，每一天都变得值得期待。

（举报）