DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声 DeeSeek掀起的滔天巨浪,让全世界为之震颤。从R1复现狂潮,到登顶美榜APPStore,再到科技股集体重挫,这股东方神秘力量威力尽显。它总共包含61个decoder块,其中前三个是全 DeepSeek 2025年02月11日 159 点赞 2 评论 240 浏览
DeepSeek推翻两座大山 DeepSeek的压力,终于还是传递到了黄仁勋身上。北京时间1月27日晚,英伟达美股股价盘前暴跌近11%,按目前市值34928亿美元计算,英伟达市值恐将缩水超3500亿美元。如果它们不 DeepSeek 2025年02月11日 214 点赞 3 评论 324 浏览
DeepSeek创始人梁文锋:中国AI不可能永远跟随 必然有人站到技术的前沿 随着DeepSeek全球爆火,其创始人梁文锋从幕后走到了台前。20日下午,高层主持召开专家、企业家和教科文卫体等领域代表座谈会。2025年1月20日,DeepSeek最新发布的R1模型不仅 DeepSeek 2025年02月10日 234 点赞 3 评论 354 浏览
DeepSeek回应崩了:与大规模恶意攻击及服务维护有关 据报道,有网友在29日晚发现给DeepSeek发送文字聊天消息时,DeepSeek回应称:不好意思,DeepSeek联网搜索服务繁忙,请关闭联网搜索功能,或者稍后再试。DeepSeek的服务稳定 DeepSeek 2025年02月10日 184 点赞 2 评论 278 浏览
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键 DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAIo1的中档推理设置相当。这样实时更新、确保公平性和可靠性的测试方法,获得了 DeepSeek 2025年02月10日 255 点赞 3 评论 386 浏览
这年头,谁在互联网上学这么“硬核”的AI? 前阵子大火的“AI届拼多多”DeepSeek,在走红之后又出现了不同的争议。一边是网友们没玩明白这个模型,一边是技术出身的博主们大肆吹捧“DeepSeekV3优雅”,甚至雷军都下场 DeepSeek 2025年02月09日 234 点赞 3 评论 354 浏览
都在扒的DeepSeek团队,是清北应届生撑起一片天 DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的 DeepSeek 2025年01月18日 133 点赞 2 评论 201 浏览
为什么说DeepSeek是2025年的Kimi DeepSeek是否能定义“低成本训练”概念?岁末年初,杭州的大模型创业公司“深度求索”DeepSeek不断放出大新闻。它所公布的一个开源模型DeepSeek-V3,在各种基准测试等方面, DeepSeek 2025年01月15日 115 点赞 1 评论 174 浏览
DeepSeek-V3 是怎么训练的|深度拆解 DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输Claude3.5的成绩,并开源!下面,让我们以更加系统的方式,来看看这次的DeepSeek-V3, DeepSeek 2025年01月02日 140 点赞 2 评论 212 浏览
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开 DeepSeek新版模型正式发布,技术大佬们都转疯了!延续便宜大碗特点的基础之上,DeepSeekV3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。QLoRA一作的一个词评 DeepSeek 2025年01月01日 116 点赞 1 评论 175 浏览