中国大模型正在从“追随者”向“并跑者”甚至“领跑者”角色加速转变。

3月30日,中文大模型基准测评最新结果。本次测评共有22款国内外主流模型参评,涵盖了数学推理、科学推理、代码生成等六大核心任务。结果显示,以“豆包”为代表的国产模型已成功杀入全球顶尖阵营。

image.png

全球视野:海外闭源模型仍守高地,豆包紧随其后

在本次测评的总分榜单上,海外闭源模型依然展现了深厚的技术底蕴:

前三强: Anthropic 的第一,不仅稳居全球第一梯队,与 GPT-5.4的分差已缩小至0.95分。

智能体突破: 在智能体任务规划维度,顶级模型展开正面硬刚。随着豆包的身位前移与小米 MiMo在细分领域的深耕,国产大模型正迎来真正意义上的“实战爆发期”。

点赞(6)

评论列表共有 0 条评论

立即
投稿
返回
顶部