李飞飞、DeepSeek为何偏爱这个国产模型? 【新智元导读】最近,李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面:昔日称霸开源界 开源模型 2025年02月15日 252 点赞 3 评论 381 浏览
颠覆LLM格局,AI2新模型OLMo2,训练过程全公开,数据架构双升级 【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo2,在同等大小模型中取得了最优性能,且该模型不止开放权重十分大方地公开了训练数据和方法。非营利研究机构AI 开源模型 2025年02月14日 144 点赞 2 评论 218 浏览
全球最大开源模型再刷爆纪录!4800亿参数MoE击败Llama 3、Mixtral 【新智元导读】最大开源模型,再次刷爆纪录!Snowflake的Arctic,以128位专家和4800亿参数,成为迄今最大的开源模型。是又大又稀疏,因此计算资源只用了不到Llama38B的一半, 开源模型 2024年04月27日 209 点赞 3 评论 316 浏览