都在扒的DeepSeek团队,是清北应届生撑起一片天 DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的 DeepSeek 2025年01月18日 129 点赞 110 评论 1 浏览
为什么说DeepSeek是2025年的Kimi DeepSeek是否能定义“低成本训练”概念?岁末年初,杭州的大模型创业公司“深度求索”DeepSeek不断放出大新闻。它所公布的一个开源模型DeepSeek-V3,在各种基准测试等方面, DeepSeek 2025年01月15日 129 点赞 110 评论 1 浏览
DeepSeek-V3 是怎么训练的|深度拆解 DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输Claude3.5的成绩,并开源!下面,让我们以更加系统的方式,来看看这次的DeepSeek-V3, DeepSeek 2025年01月02日 129 点赞 110 评论 1 浏览
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开 DeepSeek新版模型正式发布,技术大佬们都转疯了!延续便宜大碗特点的基础之上,DeepSeekV3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。QLoRA一作的一个词评 DeepSeek 2025年01月01日 129 点赞 110 评论 1 浏览
国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用 国产大模型平台DeepSeek发布了,全新推理模型DeepSeek-R1-Lite预览版。这个模型的最大特色便是深度思维链推理,尤其是在数学、代码以及各种复杂推理任务上,可以生成数万字 DeepSeek 2024年11月26日 129 点赞 110 评论 5 浏览