李飞飞、DeepSeek为何偏爱这个国产模型? 【新智元导读】最近,李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面:昔日称霸开源界 开源模型 2025年02月15日 129 点赞 110 评论 1 浏览
颠覆LLM格局,AI2新模型OLMo2,训练过程全公开,数据架构双升级 【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo2,在同等大小模型中取得了最优性能,且该模型不止开放权重十分大方地公开了训练数据和方法。非营利研究机构AI 开源模型 2025年02月14日 129 点赞 110 评论 1 浏览