GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型? 马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok3的训练中。外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。 Llama3.1 2024年08月09日 129 点赞 110 评论 71 浏览