开源模型

首页

文章中心

开源模型

列表

默认

浏览次数

创建时间

李飞飞、DeepSeek为何偏爱这个国产模型？

李飞飞、DeepSeek为何偏爱这个国产模型？

【新智元导读】最近，李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面:昔日称霸开源界

开源模型 2025年02月15日 252 点赞 3 评论 381 浏览

颠覆LLM格局，AI2新模型OLMo2，训练过程全公开，数据架构双升级

颠覆LLM格局，AI2新模型OLMo2，训练过程全公开，数据架构双升级

【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo2，在同等大小模型中取得了最优性能，且该模型不止开放权重十分大方地公开了训练数据和方法。非营利研究机构AI

开源模型 2025年02月14日 144 点赞 2 评论 218 浏览

全球最大开源模型再刷爆纪录！4800亿参数MoE击败Llama 3、Mixtral

全球最大开源模型再刷爆纪录！4800亿参数MoE击败Llama 3、Mixtral

【新智元导读】最大开源模型，再次刷爆纪录!Snowflake的Arctic，以128位专家和4800亿参数，成为迄今最大的开源模型。是又大又稀疏，因此计算资源只用了不到Llama38B的一半，

开源模型 2024年04月27日 209 点赞 3 评论 316 浏览

立即
投稿返回
顶部