AI的“去泡沫时代”，与驱动百度的三驾马车

2024-11-20 19:36 4 阅读 0 评论 3 点赞

声明:本文来自于微信公众号陆玖商业评论，作者:乔隐，授权靠谱客转载发布。

不可否认，本轮生成式AI浪潮，同样出现了预期过高的“泡沫”状态，但由于生成式AI的重资产投入特性，一些徒有其表的“伪创新”将会被毫不留情地清洗。大浪淘沙之后，以百度为代表的一批真正有技术实力、创新精神的公司将会脱颖而出，为社会带来真正的价值。

“这个世界不应该被吞噬，而应该被创造。AI时代，应用创造世界。”

双十一购物节收官的第二天，也就是11月12日，2024百度世界大会在上海世博中心开幕。相较以往，本次世界大会的丰富程度不遑多让。李彦宏在短短1个多小时的时间里，将百度过去一年的技术演进悉数呈现。

元宇宙 ai绘画科幻

图源备注：图片由AI生成，图片授权服务商Midjourney

在过去24个月的时间里，生成式AI的进化速度，超出了大多数人的想象。其中最显著的代表性变化，则是模型的幻觉被极大消除——不仅是文字层面，在图片生成上，一如百度新推出的检索增强的文生图技术 iRAG，将百度搜索的亿级图片资源跟强大的基础模型能力相结合，就可以生成各种超真实的图片。

另一方面，是模型规模控制日渐娴熟，调优技术的日益演进使然。不过更重要的点在于，相较以往面对基础大模型的简单“套壳”，如今已经有AI搜索、智能体等更成熟的应用加持，其技术力、可信度都实现了质的提升。

在世界大会上，李彦宏指出，过去这24个月，大模型基本消除了幻觉，它回答问题的准确性大大地提升了——这让AI从“一本正经的胡说八道”，变得可用、可被信赖。

生成式AI的“去泡沫时代”

如果将时间轴拉长，AI从诞生开始至今，历经的“泡沫”和“去泡沫”时代，难以数说。

在这次生成式AI浪潮中，又卷模型又卷应用的创业方，成本不仅涵盖了人力、运营，还有算力、模型等昂贵的硬件成本，都需要自行融资承担。这导致无论是出资方还是创业方，其承受的压力比移动互联网时代的创业更大，出清速度也会更快。

正如李彦宏所言，泡沫过后，一些无法满足市场需求的伪创新将会被清洗掉，在这之后，有1%的企业将脱颖而出，继续成长，为社会创造巨大价值。现在，我们只是在经历这个阶段，这个行业比去年更冷静，也更健康。

这段话并非空穴来风，一方面，基于通用大模型稍加修改即上线的“AI产品”，在GPT出世的前一年如雨后春笋，但到现在已经十不存一;另一方面，真正“活下来”，并不断迭代形态的原生AI应用，正以超出预期的速度发展并壮大。

以百度为例，文库业务和智能体等业务的重构与跨越，是李彦宏重点提出的发展目标。

如今回过头来，我们不难发现，李彦宏年初画下的“大饼”，如今多数已成现实。

譬如公司类的智能体，它相当于AI时代的企业官网，原有的公司介绍、产品图片、参数展示等必要信息一应俱全，还能针对用户特征和需求进行智能推荐，替代人工进行及时响应和主动服务，帮助客户更全面立体地了解产品。

如今，在百度APP搜索“比亚迪”，就能直接唤起它的官方智能体。除了默认的公司介绍，还能基于自身需求输入各类相关问题，而非以往的“定向问答”。智能体的直接效果则是比亚迪的官方智能体上线后，销售线索的转化率完成了翻番，提升了119%。

再如工具类的智能体，典型者如百度文库和网盘联合开发的工具类智能体——“自由画布”。

据了解，它不仅支持包括文档、图片、音视频等多格式文件的自由输入，还能对上述多格式文件进行AI总结，重点框记，据此完成新内容的AI创作，播客的制作同样也不在话下。需要注意的是，生成的文件，已经不再是单一媒体格式，模态已经多样化。

此时，与网盘的联动价值开始体现——仅仅通过一个链接，就可以通过一个链接，直接实现分享、查看、二次编辑等操作，还能一键存储至百度网盘。

对于范围更大，更下沉的普通C端用户，则到了端到端行业智能体的发力点。但这类专业智能体，仅靠百度一家，同样孤掌难鸣。因此，百度邀请了英伟达作为技术合作伙伴，以“智能体创新大赛”的形式，创造出更多有价值的智能体应用，并为千行百业的用户使用和分享——截至目前，文心智能体平台已经吸引了多达15万家企业和80多万名开发者参与。

新生态新驱动

据弗若斯特沙利文发布的报告《2024年全球AI生态全景概览》，在全球AI生态全景中，百度与谷歌、OpenAI位于AI-Native Giant 同一象限。

当然，这不是简单的“排座次”——当一家AI公司，其模型、应用、生态等层面，已经形成自我造血的“自循环”，方能在其中占据一席之地。

OpenAI作为AI原生巨头，自是有一席之地，但就在几天前，他也不得不坦言，“总体上，产品是我的弱点”。

而要实现商业化，基于可用模型的应用层，则是必由之路，AI厂商“卷应用”的时代，已然到来。

根据李彦宏在世界大会现场的分享，他曾在半年前，与高管们讨论大模型“成了”的标准，“我当时说，如果我们的调用量日均的API调用量，大模型API调用量，一年之内如果涨10倍，也就是从2亿涨到20亿，一年时间涨10倍，我认为就成了，就说明大家是真需要。”

而在半年时间里，文心大模型的日均API调用量增长7.5倍，目前已经超过15亿次，距离李彦宏20亿的目标，已经非常接近。

一方面，这是基于文心大模型的先发优势，在最早时间获取了最大数量的“种子用户”使然;另一方面，其在近两年时间里的进化速度，同样有目共睹。

其中一个显著变化是，基于神经网络技术路线的大模型，其固有的“幻觉”缺陷，已经很大程度上被克服，具体的体现则是回答问题的准确性大幅提升。

众所周知，基于模型内部的“黑盒”属性，其具体的推理过程和模型决策过程，至今仍然难以一窥全貌。它的技术根源在于，AI技术的本质在于对语言的概率模型预测，通过庞大的训练数据对下一个token进行推测。当这种生成机制不足以捕捉复杂的上下文关系时，模型就可能毫无根据地生成显著偏离事实的信息。

百度祭出的解决方案，则是“RAG”技术，它包括两个主要阶段:检索上下文相关信息和使用检索到的知识指导生成过程。这个过程使得大模型能够更准确地回答用户的问题。

截至目前，文字层面的RAG应用已经臻于成熟。日均15亿次的API调用量，一方面是用户“用脚投票”，佐证文心一言的可用，好用;另一方面，源源不断的调用，所产生的新数据，也可用于文心一言的进一步调优，使其准确性更上一层楼。

不过，文生图环节，是相比文生文不遑多让的“幻觉”重灾区，用户对于提示词的不熟练是一方面，生成效果“过于古神”又是另一方面。比较显著的一个例子，则是七八个手指的手掌，和四层楼的天坛。

今年初百度决定解决图形生成的幻象问题，自研的IRAG技术，即是集中的成果体现。它结合了检索和生成的技术方法，可以有效提升生成内容的可靠性和准确性，且对各种指令的理解，精准度更高。

还是以天坛为样本，如果在文心一言4.0turbo里输入“在雪山里的天坛”，如今能“立等可取”的结果，不仅是三层楼的，存在于现实世界里的“真实天坛”，其后的雪山场景，也可以根据用户的各种商业与非商业的需求，生成自己想要的效果，已经无限接近商用场景。

至此，百度也为图生文应用打开了商业化的大门，让生成结果有了真正的用武之地。

AI与三驾马车

无论是雨后春笋般涌现的原生AI智能体，抑或是“RAG”加持的文生文、文生图应用，诸如此类的智能产业生态，其稳定运行必须要有稳定的算力提供和针对模型的精调服务，就百度而言，其智能云服务则是主要依托。

作为国内最大的连锁餐饮集团之一，百胜与百度的合作颇具代表性。早期合作阶段，百度先帮助百胜完成了新增门店选址工作，数量达到数千家;

深入到客服领域，针对庞大且复杂的客诉需求，百度提供了大模型加持的客服产品，解决了此前百胜因为难以识别客户真实意图，没法关联上下文的问题。

截至目前，客服应用和解决方案已经覆盖了百胜全线业务，大模型调用量也升至百万级，其“问题解决率”上升到了90%，但这只是一个开始，随着千帆平台、文心Speed模型、基础云算力服务等能力的提供，百胜已经拥有了初步且完善的大模型底座能力，后续的AIGC应用开发计划，已经不再是空中楼阁。

自动驾驶同样也是大模型重构的重点环节。一方面，Apollo自动驾驶开放平台10.0即将发布，将搭载百度最新的自动驾驶大模型ADFM，大模型“上车”的意义，某种程度上与重构其它业务的逻辑一致，在于提升自动驾驶开放平台的安全性、智能化和易用性。

所谓安全性，是指其自动驾驶的安全性要做到人类驾驶员的10倍以上。截至2024年6月，百度自动驾驶实际道路测试与示范里程超过1亿公里，从未发生过重大伤亡事故;为每辆无人车及乘客购买了保额为500万的保险，过去两年的数据显示，实际车辆出险率仅为人类司机的1/14。这也在客观上，为其创造了进军全球的条件。

在世界大会，李彦宏用“AI applications are creating the world”作为了整场演讲的结语（AI 应用正在创造这个世界），他之所以有如此底气，很大程度在于，通过近两年时间的全面重构，百度原有的产品矩阵，借助更集中的用户生态和用户数据，得到了再进一步的可能性。

这不是所谓的“百尺竿头，更进一步”，而是在生成式AI的“军备竞赛”上，无论是卷应用还是卷生态，每在技术和应用上前进一步，意味着整体效率的提升，其身位与后来者，将会拉得更远，而在马太效应极为明显的AI行业，则是“全部带走”和“一无所有”的差别。

很显然，想用AI创造一个世界的李彦宏，和他的百度，在进步或平庸的选择题上，并没有过任何迟疑。

（举报）