声明:本文来自于微信公众号Tech星球(微信ID:tech618),作者:任雪芸,授权靠谱客转载发布。
比预想中更快一步,3月16日,百度正式发布文心大模型4.5(以下简称文心4.5)及文心大模型X1(以下简称文心X1),在文心一言官网即可免费使用。
文心4.5不仅在基础能力上有大幅度提升,且具备原生多模态等能力,其多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并且平均分达到79.6分,高于GPT4.5的79.14。文心X1不仅在性能上对标DeepSeek-R1,且具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运动工具的深度思考模型。
和DeepSeek横空出世一样,文心4.5和文心X1不仅点燃了国内用户的热情,更让外网沸腾。在推特上,不少人纷纷在求百度测试账号,他们为两大模型优异的性能和超低的价格感到不可思议,不少人觉得百度的股价被低估了。甚至有人在百度推特账号下@萨姆·奥尔特曼,他们表示游戏结束了。
在看到文心新模型的表现后,在推特上拥有70万粉丝的美国投资人Bill Gurley感慨道,美国人工智能公司应将100%的时间用于开发和创新,而不是在华盛顿特区游说寻求保护以躲避竞争。这种情况很糟糕,明显暴露出缺乏自信。
两大模型的优异能力,是对过去3月外界对于“百度大模型掉队了”最有效的回应,也再一次证明了百度对AI战略贯彻到底的决心。毕竟,大模型竞技是一场持久战,拼的是耐力、技术、资本。从Transformer到OpenAI-o1和DeepSeek-R1,技术的更新时刻在发生,没有人可以保证永远领先,但关键的是敢拼的勇气。
所有玩家从来没有放弃和停止在大模型领域的努力,百度也是如此。开年以来,百度在大模型领域动作频频——文心一言完全免费、文心4.5将于6月30日正式开源;百度核心业务搜索接入DeepSeek;很快百度还会发布4.5系列模型,以及更前沿的下一代模型5.0版本。
动作频频的背后,透露出百度依然想留在牌桌上的决心,它也确实做到了。但百度并不能掉以轻心。因为,大模型的终局远未到来,包括百度在内,所有的玩家都必须全力以赴。这也是百度坚持不懈的根源。
百度加速变革:一场必要的战略纠偏
半个月之前,OpenAI举办了一场线上发布会,正式发布了其最新一代基础模型GPT-4.5。3月16日,百度并没有任何发布动作,而是直接上线了文心4.5与文心X1。
这场上线发生得悄无声息。有百度内部人士称,无论是文心4.5全面免费,还是PC和移动两端直接上线,百度管理层都是在半天之内做出的决策。
这似乎是现在的百度与过去的百度,以及行业的一场赛跑。
这一次的百度越来越快了。据百度方面透露,此次文心4.5和X1大模型发布之后,百度后续还会推出文心4.5系列模型,以及在下半年推出更先进的下一代模型5.0版本。
其实,此次模型迭代进程明显加快,并非偶然。这一现象背后,其实是百度对过往策略选择的反思与积极纠偏。
过去半年间,DeepSeek等新兴公司凭借开源、低成本的模式,给OpenAI、百度这类传统大模型巨头带来了不小的压力。如今,全球AI企业中,无论是OpenAI,还是百度,都逐渐意识到,大模型领域未来走向依旧充满变数,尚无定论。
激烈竞争的大模型领域,保持竞争力的关键在于果敢地 “求变”。于是,就在今年2月,比OpenAI更快一步,百度决定及时转变策略。
随后,百度创始人李彦宏就快速且坚决地推动了一系列动作:文心一言免费、核心业务搜索接入DeepSeek、文心大模型4.5系列将在6月30日正式开源等。
这次纠偏是文心一言对当下市场竞争的直接回应。从悄然上线文心4.5与X1,以及后续透露的一系列迭代计划,无一不彰显出百度谋求变革的坚定决心。
不过,百度突然加快脚步,让外界有人质疑它可能会迷失方向。但目前来看,百度的“变快”建立在对自身技术实力与市场趋势的研判上,每一次模型的迭代都伴随着技术架构的深度优化,以及性能的飞跃提升。
从百度自有业务来看,百度旗下多款用大模型重构后的AI应用,包括百度App、百度地图、百度网盘、百度文库等体验感都在持续提升。在此次文心4.5与文心X1上线后,这些应用也在迎来全方位升级。
让大模型产品,植入“原生技术内核”
作为百度重回牌桌的阶段性产品,原生多模态大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面实现了蜕变与升级?
据了解,文心4.5是百度自主研发的新一代原生多模态大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。
而文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运用工具的深度思考模型,兼备准确、创意和文采。
基于文心大模型4.5和文心大模型X1,Tech星球分别实测了一些应用场景。
我们上传了一段“体重管理年”的新闻视频,要求文心4.5概括新闻内容,可以看到其给出了准确的回答,证明了其跨模态的能力。目前,文心4.5支持上传的视频文件,兼容常见的格式,单个视频文件大小不超过20M。
在图片理解上,通过这个问题也能够看出在图形推理、图表分析的“高智商”以外,文心4.5还具备了理解梗图、漫画、歌曲、电影等多模态内容的“高情商”。
此外,文心4.5的能力也在图片生成、RAG(Retrieval Augmented Generation检索生成增强)测试、逻辑测试、文本创作等方面得到了很好地体现。
在文心X1的测试中能够看到,作为一个能力更全面的深度思考模型,其在逻辑问题中展现了周密的思考过程,且在答案的输出上更为明确、直接。
在文本创作类的问题中,也能够看出文心X1擅长写“锐评”,避免“端水”,回答尖锐有态度。
Tech星球获悉,文心X1在技术层面颇具创新,主要运用递进式强化学习训练方法,以思维链和行动链为依托开展端到端训练,还构建起统一的奖励系统,融入多元奖励机制。
凭借这些技术,文心X1能够在诸多场景中大显身手,包括中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算等。
此外,多工具调用是文心X1的特色之一。目前,X1已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询、词云生成等多款工具。
技术+场景,大模型的生态战
今年2月11日,李彦宏参加“世界政府峰会”WGS 访谈时曾表示,从技术的基础要素来看,核心主题依然是技术进步得非常快。成本每年降低约90%,并且性能越来越好。当技术发展如此之快,你必须持续投入,以确保处于技术创新的最前沿。
换句话说,大模型的竞争首先是技术实力的竞争,最直观的体现是价格。文心4.5输入价格为0.004元/千tokens,输出0.016元/千tokens,约为GPT4.5价格的1%;文心X1定价为输入0.002元/千tokens,输出0.008元/千tokens,是DeepSeek R1的一半。
效率得以大幅度提升,背后是百度通过全栈自研能力构建了“芯片层、框架层、模型层和应用层”的竞争壁垒。从昆仑芯三代万卡集群的算力支撑,到飞桨深度学习平台的开发者生态,再到文心大模型体系的多层次迭代以及AI重构的百度搜索、近亿用户的百度文库,每一层都有反馈,通过不断获得反馈,实现了端到端优化,大幅度提升效率。这也是百度近十年累计研发费用超过1800亿元的正向反馈。
成本的降低让百度有了实现AI普惠的底气,也为接下来文心4.5的开源打下了坚实的基础。通过开放模型权重、训练框架等核心能力,吸引开发者共建,百度会拥有更加繁荣的开发生态,构建更深的护城河。因为开源不仅是技术输出,更是生态卡位。
文心一言将于4月1日取消59.9元/月的付费墙,免费开放表面看是“割肉”,实则是双赢。这种“零门槛”的模式,让更多人可以享受技术进步带来的乐趣。同时,百度在4.3亿用户基数的基础上得以形成更大的数据飞轮效应,驱动模型持续优化。
开源和免费的战略转向是百度应对行业变局的标志性动作,它让每一个人都可以参与到创新中来。就像李彦宏所言,“创新不能被计划,你不知道创新何时到来,你所能做的就是营造一个有利于创新的环境。”
更重要的是,技术的终局从来不是参数的比拼,而是在于解决现实生活中的问题。百度已经将这种理念落地实践。被AI深度重构的百度搜索有超过20%的页面含有AI生成的内容,近亿用户使用的百度文库可以智能生成PPT、文档,已经成为“一站式AI内容创作平台”,其AI功能月活达9000万。
更进一步看,大模型比拼的不仅仅是技术实力,更是一场以技术生态为核心、以场景落地为驱动的生态战争。这也是百度和其他创业公司的根本区别,百度旗下拥有亿级用户的搜索、地图、文库等应用都是AI的落地试验场。
不仅如此,百度智能云千帆大模型平台预置了包括百度文心大模型在内的、国内外上百个主流基础大模型和行业大模型,还为大模型的持续预训练、精调、评估、压缩和部署等环节提供最完善易用的工具链,它已经帮助客户精调了3.3万个模型、开发了77万个企业应用。
站在大模型爆发的前夜,百度的转向证明:AI的未来属于激活生态的玩家,而非单一技术的掌控者。当开源成为行业标配,真正的竞争将聚焦于“如何让每个人在创新中获益”——这或许才是李彦宏“创新不能被计划”断言的终极答案。
(举报)
发表评论取消回复