百度文心4.5与X1登场后，大模型第一梯队的竞争再升级？

2025-03-19 01:09 431 阅读 0 评论 285 点赞

声明：本文来自于微信公众号Tech星球（微信ID:tech618），作者：任雪芸，授权热心网友转载发布。

比预想中更快一步，3月16日，百度正式发布文心大模型4.5（以下简称文心4.5）及文心大模型X1(以下简称文心X1)，在文心一言官网即可免费使用。

文心4.5不仅在基础能力上有大幅度提升，且具备原生多模态等能力，其多项基准测试成绩优于GPT4.5、DeepSeek-V3等，并且平均分达到79.6分，高于GPT4.5的79.14。文心X1不仅在性能上对标DeepSeek-R1，且具备更强的理解、规划、反思、进化能力，并支持多模态，是首个自主运动工具的深度思考模型。

和DeepSeek横空出世一样，文心4.5和文心X1不仅点燃了国内用户的热情，更让外网沸腾。在推特上，不少人纷纷在求百度测试账号，他们为两大模型优异的性能和超低的价格感到不可思议，不少人觉得百度的股价被低估了。甚至有人在百度推特账号下@萨姆·奥尔特曼，他们表示游戏结束了。

在看到文心新模型的表现后，在推特上拥有70万粉丝的美国投资人Bill Gurley感慨道，美国人工智能公司应将100%的时间用于开发和创新，而不是在华盛顿特区游说寻求保护以躲避竞争。这种情况很糟糕，明显暴露出缺乏自信。

两大模型的优异能力，是对过去3月外界对于“百度大模型掉队了”最有效的回应，也再一次证明了百度对AI战略贯彻到底的决心。毕竟，大模型竞技是一场持久战，拼的是耐力、技术、资本。从Transformer到OpenAI-o1和DeepSeek-R1，技术的更新时刻在发生，没有人可以保证永远领先，但关键的是敢拼的勇气。

所有玩家从来没有放弃和停止在大模型领域的努力，百度也是如此。开年以来，百度在大模型领域动作频频——文心一言完全免费、文心4.5将于6月30日正式开源;百度核心业务搜索接入DeepSeek;很快百度还会发布4.5系列模型，以及更前沿的下一代模型5.0版本。

动作频频的背后，透露出百度依然想留在牌桌上的决心，它也确实做到了。但百度并不能掉以轻心。因为，大模型的终局远未到来，包括百度在内，所有的玩家都必须全力以赴。这也是百度坚持不懈的根源。

百度加速变革:一场必要的战略纠偏

半个月之前，OpenAI举办了一场线上发布会，正式发布了其最新一代基础模型GPT-4.5。3月16日，百度并没有任何发布动作，而是直接上线了文心4.5与文心X1。

这场上线发生得悄无声息。有百度内部人士称，无论是文心4.5全面免费，还是PC和移动两端直接上线，百度管理层都是在半天之内做出的决策。

这似乎是现在的百度与过去的百度，以及行业的一场赛跑。

这一次的百度越来越快了。据百度方面透露，此次文心4.5和X1大模型发布之后，百度后续还会推出文心4.5系列模型，以及在下半年推出更先进的下一代模型5.0版本。

其实，此次模型迭代进程明显加快，并非偶然。这一现象背后，其实是百度对过往策略选择的反思与积极纠偏。

过去半年间，DeepSeek等新兴公司凭借开源、低成本的模式，给OpenAI、百度这类传统大模型巨头带来了不小的压力。如今，全球AI企业中，无论是OpenAI，还是百度，都逐渐意识到，大模型领域未来走向依旧充满变数，尚无定论。

激烈竞争的大模型领域，保持竞争力的关键在于果敢地 “求变”。于是，就在今年2月，比OpenAI更快一步，百度决定及时转变策略。

随后，百度创始人李彦宏就快速且坚决地推动了一系列动作:文心一言免费、核心业务搜索接入DeepSeek、文心大模型4.5系列将在6月30日正式开源等。

这次纠偏是文心一言对当下市场竞争的直接回应。从悄然上线文心4.5与X1，以及后续透露的一系列迭代计划，无一不彰显出百度谋求变革的坚定决心。

不过，百度突然加快脚步，让外界有人质疑它可能会迷失方向。但目前来看，百度的“变快”建立在对自身技术实力与市场趋势的研判上，每一次模型的迭代都伴随着技术架构的深度优化，以及性能的飞跃提升。

从百度自有业务来看，百度旗下多款用大模型重构后的AI应用，包括百度App、百度地图、百度网盘、百度文库等体验感都在持续提升。在此次文心4.5与文心X1上线后，这些应用也在迎来全方位升级。

让大模型产品，植入“原生技术内核”

作为百度重回牌桌的阶段性产品，原生多模态大模型文心4.5以及深度思考模型文心X1，究竟在哪些方面实现了蜕变与升级?

据了解，文心4.5是百度自主研发的新一代原生多模态大模型，通过多个模态联合建模实现协同优化，多模态理解能力优秀;具备更精进的语言能力，理解、生成、逻辑、记忆能力全面提升，去幻觉、逻辑推理、代码能力显著提升。

而文心大模型X1具备更强的理解、规划、反思、进化能力，并支持多模态，是首个自主运用工具的深度思考模型，兼备准确、创意和文采。

基于文心大模型4.5和文心大模型X1，Tech星球分别实测了一些应用场景。

我们上传了一段“体重管理年”的新闻视频，要求文心4.5概括新闻内容，可以看到其给出了准确的回答，证明了其跨模态的能力。目前，文心4.5支持上传的视频文件，兼容常见的格式，单个视频文件大小不超过20M。

在图片理解上，通过这个问题也能够看出在图形推理、图表分析的“高智商”以外，文心4.5还具备了理解梗图、漫画、歌曲、电影等多模态内容的“高情商”。

此外，文心4.5的能力也在图片生成、RAG（Retrieval Augmented Generation检索生成增强）测试、逻辑测试、文本创作等方面得到了很好地体现。

在文心X1的测试中能够看到，作为一个能力更全面的深度思考模型，其在逻辑问题中展现了周密的思考过程，且在答案的输出上更为明确、直接。

在文本创作类的问题中，也能够看出文心X1擅长写“锐评”，避免“端水”，回答尖锐有态度。

Tech星球获悉，文心X1在技术层面颇具创新，主要运用递进式强化学习训练方法，以思维链和行动链为依托开展端到端训练，还构建起统一的奖励系统，融入多元奖励机制。

凭借这些技术，文心X1能够在诸多场景中大显身手，包括中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算等。

此外，多工具调用是文心X1的特色之一。目前，X1已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询、词云生成等多款工具。

技术+场景，大模型的生态战

今年2月11日，李彦宏参加“世界政府峰会”WGS 访谈时曾表示，从技术的基础要素来看，核心主题依然是技术进步得非常快。成本每年降低约90%，并且性能越来越好。当技术发展如此之快，你必须持续投入，以确保处于技术创新的最前沿。

换句话说，大模型的竞争首先是技术实力的竞争，最直观的体现是价格。文心4.5输入价格为0.004元/千tokens，输出0.016元/千tokens，约为GPT4.5价格的1%;文心X1定价为输入0.002元/千tokens，输出0.008元/千tokens，是DeepSeek R1的一半。

效率得以大幅度提升，背后是百度通过全栈自研能力构建了“芯片层、框架层、模型层和应用层”的竞争壁垒。从昆仑芯三代万卡集群的算力支撑，到飞桨深度学习平台的开发者生态，再到文心大模型体系的多层次迭代以及AI重构的百度搜索、近亿用户的百度文库，每一层都有反馈，通过不断获得反馈，实现了端到端优化，大幅度提升效率。这也是百度近十年累计研发费用超过1800亿元的正向反馈。

成本的降低让百度有了实现AI普惠的底气，也为接下来文心4.5的开源打下了坚实的基础。通过开放模型权重、训练框架等核心能力，吸引开发者共建，百度会拥有更加繁荣的开发生态，构建更深的护城河。因为开源不仅是技术输出，更是生态卡位。

文心一言将于4月1日取消59.9元/月的付费墙，免费开放表面看是“割肉”，实则是双赢。这种“零门槛”的模式，让更多人可以享受技术进步带来的乐趣。同时，百度在4.3亿用户基数的基础上得以形成更大的数据飞轮效应，驱动模型持续优化。

开源和免费的战略转向是百度应对行业变局的标志性动作，它让每一个人都可以参与到创新中来。就像李彦宏所言，“创新不能被计划，你不知道创新何时到来，你所能做的就是营造一个有利于创新的环境。”

更重要的是，技术的终局从来不是参数的比拼，而是在于解决现实生活中的问题。百度已经将这种理念落地实践。被AI深度重构的百度搜索有超过20%的页面含有AI生成的内容，近亿用户使用的百度文库可以智能生成PPT、文档，已经成为“一站式AI内容创作平台”，其AI功能月活达9000万。

更进一步看，大模型比拼的不仅仅是技术实力，更是一场以技术生态为核心、以场景落地为驱动的生态战争。这也是百度和其他创业公司的根本区别，百度旗下拥有亿级用户的搜索、地图、文库等应用都是AI的落地试验场。

不仅如此，百度智能云千帆大模型平台预置了包括百度文心大模型在内的、国内外上百个主流基础大模型和行业大模型，还为大模型的持续预训练、精调、评估、压缩和部署等环节提供最完善易用的工具链，它已经帮助客户精调了3.3万个模型、开发了77万个企业应用。

站在大模型爆发的前夜，百度的转向证明:AI的未来属于激活生态的玩家，而非单一技术的掌控者。当开源成为行业标配，真正的竞争将聚焦于“如何让每个人在创新中获益”——这或许才是李彦宏“创新不能被计划”断言的终极答案。

（举报）