DeepSeek大模型引发美国关注
DeepSeek大模型的卓越性能引发美国人工智能界关注,其训练成本远低于竞争对手,引发美国政府的猜测和调查。
训练规模存疑
尽管DeepSeek没有透露详细的训练硬件配置,但据称仅使用了2048颗H800 GPU,在两个月内训练了6710亿个参数的大模型。
相比之下,Meta使用16381颗H100 GPU训练了4050亿个参数的大模型,耗时54天,训练成本差异巨大。
潜在的监管漏洞
半导体研究机构SemiAccurate提出,DeepSeek可能囤积了约6万颗NVIDIA GPU,其中包括H100、A100、H20和H800型号,总成本超过140亿元。
美国对中国出口H100和A100 GPU施加限制,但H800一度作为特供版获得豁免,后也被限制。只有H20完全符合出口规定。
美国怀疑DeepSeek通过新加坡第三方公司获得了管制出口的H100 GPU,数量可能多达5万颗。
新加坡收入激增
NVIDIA财报显示,2022年底,新加坡贡献的收入仅占9%,而目前已飙升至22%,引发异常疑虑。
调查仍在进行
白宫和FBI等机构正在调查DeepSeek是否通过新加坡获得了受限的NVIDIA AI GPU。
美国呼吁对新加坡实施更严格的出口管控措施,防止受限产品流入中国。
证据不足,NVIDIA回应
截至目前,美国政府尚未发现确凿证据支持相关指控。
NVIDIA回应称,其严格遵守法律要求,与新加坡的大多数交易均运往其他地区,并非中国。
NVIDIA强调,新加坡相关的收入不表示转移到中国,其公开文件显示的是客户账单地址,而非发货地址。
(举报)
发表评论取消回复