阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”，黄仁勋表示“给你加速 50 倍”

2024-11-15 10:03 181 阅读 0 评论 120 点赞

AI 界最有影响力的两个人，同时出现在一场活动：OpenAI CEO 阿尔特曼，暗示了 o1 满血版将在接下来几个月发布。

英伟达创始人黄仁勋，则表示新一代 Blackwell 架构 GPU 能给 o1 推理提速 50 倍。

阿尔特曼称 o1 仅仅是“推理模型的 gpt-2”，黄仁勋表示“给你加速 50 倍”

阿尔特曼把 o1 在推理模型里的地位比作语言模型中的 GPT-2 阶段。

几年后人们将看到“推理模型的 GPT-4”，不过最近几个月就会有重大改进，新范式的进步曲线非常陡峭。

L2“推理者”与 L1“聊天机器人”非常不同，大家还没找到该怎么用这些模型，我们也没决定该为 App 继续添加什么功能。
不过最令人兴奋的是 L3“智能体”会来得非常快。

有医学教授看到这里，已经在考虑辞职的事了。

阿尔特曼称 o1 仅仅是“推理模型的 gpt-2”，黄仁勋表示“给你加速 50 倍”

话说 o1 系列正式登 Lmsys 大模型竞技场，第一次分数结算，在数学任务上断崖式领先，唯一的缺点就是回答有点慢了。

阿尔特曼称 o1 仅仅是“推理模型的 gpt-2”，黄仁勋表示“给你加速 50 倍”

对此，老黄的看法是：

英伟达最新 Blackwell 架构 GPU 将推理性能提高了 50 倍，意味着能把 o1 模型的响应时间从几分钟缩短到几秒。

以上内容来自 T-Mobile 资本市场日，T-Mobile 刚刚与 OpenAI 签了大单，合作建立一个 AI 支持的客服系统。

不过这场活动上，除了几家公司的合作之外，围绕 AI 的现在和将来，两位行业大佬还分享了更多值得关注的内容。

至于 o1 在数学、代码之外的任务表现如何，请看以下由 o1 主导、量子位辅助整理的原文精翻。

阿尔特曼：OpenAI 的秘诀是信念和专注

主持人：我想先祝贺你们推出了 o1 模型，或许你可以向观众介绍一下这个新模型，因为它实在是太令人惊叹了。

Sam Altman：是的，我们对此感到非常兴奋，这也是我们长期以来一直在努力的方向。GPT 系列模型在“系统 1”类型的思维上表现出色，但我们真正想要的是能够进行推理的系统。

如果人工智能能够解决更复杂的问题，其价值将是巨大的。你在 GPT-4 模型中已经看到了一些端倪，但 o1 是真正第一个能够进行高级推理的系统。无论是复杂的编程挑战、数学问题还是科学难题，你都可以获得非常非凡的结果。我们相信，随着时间的推移，这将与 GPT 系列一样重要，并解锁一系列新的、有价值的应用场景。

主持人：你曾公开表示，我们现在看到的是预览版，而且它会迅速迭代，未来几个月内会发生什么？

Sam Altman：我认为现在的新型推理模型类似于我们在 GPT-2 时期。你会在未来几年内看到它发展到与 GPT-4 相当的水平。即使在接下来的几个月内，你也会看到显著的进步，随着我们从 o1-preview 升级到 o1 正式版。

我认为，在新范式出现的这些时刻，有很多有趣的事情，其中之一就是改进曲线非常陡峭。一些模型目前无法解决的问题，可能在几个月后就能解决，几个月后又能解决更多。最重要的是，我们将看到一整套全新的使用方式，不仅仅是聊天界面。我们需要一些时间来构建这些功能，其他人也需要时间，用户也需要时间来适应。这与 GPT 模型有很大的不同。

我们谈到 AI 的五个级别：L1 是聊天机器人（ChatBot），L2 是我们刚刚达到的推理者（Reasoner），L3 是智能体（Agent），L4 是创新者（Innovator），能够发现新的科学信息，L5 是完整的组织（Organization）。

从 L1 到 L2 花了一段时间，但我认为 L2 最令人兴奋的事情之一是它能够相对快速地实现 L3，我们预计这种技术最终将带来的智能体将非常有影响力。

阿尔特曼称 o1 仅仅是“推理模型的 gpt-2”，黄仁勋表示“给你加速 50 倍”

（省略一段商业互吹）

主持人：稍微转变一下话题，为什么 OpenAI 能够领先？在这个领域你们做了什么不同的事情，使你们能够以这样的速度开发这些模型？

Sam Altman：首先，谢谢你的赞美，这是一个非常好的评价。我们建立在之前大量工作的基础上，人工智能是一个古老的领域，人们长期以来一直在为其贡献非常出色的想法。想一想在整个人类历史中，人们为了发现半导体、制造芯片、建立网络和这些大型数据中心所需要的所有工作，我们只是在这些之上做了我们自己的一小部分。

但我们尽力做到最好，我们努力拥有一个非常专注的研究计划。我认为其他研究计划犯的错误之一是他们没有足够的信念和专注。一旦某些东西起作用，复制它非常容易。

所以我认为成功的两种方式是，要么成为一个出色的快速追随者，复制 OpenAI 或其他成功的公司所做的事情，我并不是以负面的方式说这个，因为我认为有很多公司只是等待看看什么有效，然后在改善和执行方面做得非常好。

要么试图推动前沿，这是非常困难的，需要在复杂的环境中跨越许多人拥有信念和专注，这是最好的前进方式。这就是我们努力去做的。

我们真的相信深度学习，我们真的相信从现在的位置到 AGI 及更远的道路，但我们愿意根据我们在过程中学到的东西进行纠正。我们将继续努力，以我们最大的力量去做下一件事，并相信随着时间的推移，这将产生福利效应。

这对我们来说确实有效，方法就这么简单。

黄仁勋：年轻人都将拥有伴随一生的机器人

（再省略一大段商业互吹和 T-mobile 业务内容）

主持人：我们刚刚与 Sam Altman 谈到了 AI 的快速发展，其中一件事是 AI 需要极低的延迟，快速的响应时间。因为 AI 正在从传统的文本形式转向实时响应视频、面部表情、与虚拟形象互动，这需要极高的响应速度。未来的 AI 工作负载将需要靠近客户的网络中的计算能力。

黄仁勋：确实如此，我们现在将无线电计算和 AI 计算融合到一个架构中，这台我们构建的计算机具有极低的延迟，CUDA 也具有极低的延迟，能够处理时间敏感的事务，所有你需要的东西，以提供高质量的语音服务。

人们没有意识到的一点是，全球的无线网络是非常冗余的。之所以冗余是因为当有人需要时，必须提供极高的服务质量。但当没有人需要时，那些基础设施就闲置着，可以被重新利用。

因此，当我们使其可以被软件定义、加速化、能够处理 AI，我们现在将整个网络转化为在需要时可用于其他机会的过剩容量。这将是电信行业一个巨大的新增长机会。

主持人：我非常喜欢。我们还有几分钟时间，在我们让你离开之前，让我们换个话题，谈谈你所兴奋的事情。

英伟达拥有一个令人难以置信的视角，因为所有处于 AI 前沿的人都在与你们合作。当你思考我们这一生中最具变革性的技术如何真正改变人们的生活时，是什么让你感到兴奋？你认为 AI 将如何影响我们所有人？

黄仁勋：我们都会有一大批数字助手与我们一起工作。我非常喜欢这个想法，我将拥有一台计算机，随着时间的推移，它与我一起工作，变得越来越聪明，理解我，帮助我完成任务。我喜欢我将拥有自己的 R2-D2 和 C-3PO（星球大战中的机器人）。

阿尔特曼称 o1 仅仅是“推理模型的 gpt-2”，黄仁勋表示“给你加速 50 倍”

我的 R2 将一直跟着我。对于许多年轻人来说，他们将拥有自己的 R2，伴随他们一生。那个 R2 可以是数字版本，也可以是实体版本。所有人都能拥有，无论你是科学家、工程师、哲学家，还是普通人，我们都会有这些令人惊叹的助手，帮助我们度过生活。

（对于老黄关于机器人的这个观点，马斯克也跑到评论区发表赞同。）

阿尔特曼称 o1 仅仅是“推理模型的 gpt-2”，黄仁勋表示“给你加速 50 倍”

黄仁勋：最近，Sam 提出了一个观点，这些 AI 的推理能力将变得更加聪明，但这需要更多的计算能力。目前，在 ChatGPT 中的每个提示都是一个路径，未来将在内部有数百个路径。它将进行推理，进行强化学习，试图为你创造更好的答案。

这就是为什么在我们的 Blackwell 架构将推理性能提高了 50 倍。通过将推理性能提高 50 倍，那个现在可能需要几分钟来回答特定提示的推理模型，可以在几秒钟内回应。因此，这将是一个全新的世界，我对此感到兴奋。

主持人：你怎么看待能耗方面的变化？这是 AI 最受关注的方面之一，即碳足迹。

黄仁勋：我们必须使用 AI 来减少能源消耗。我们现在知道，我们可以比使用传统超级计算机进行气候和天气预测的能源效率高一万倍。摩尔定律确实已经走到了尽头，我们必须使用一种新方法来解决这些计算。

我举的一个例子是，我的养的小狗不懂牛顿物理学，他们不理解球会以什么轨迹运动。我们知道，世界上第一台超级计算机是为了模拟导弹的轨迹而创建的。然而，狗经过一些练习，可以轻松地从空中抓住球，有时还在空翻中。那么它们是如何做到的呢？这是同样的思路。

因此，我们将教 AI 不通过物理学、动力学、流体动力学等方式来计算天气，而是教它去预测。它可能并不完全理解因果关系，但它的预测非常出色。我们只想知道明天的天气会怎样。这是一个例子。我们想对无线电网络做同样的事情。我们理解电磁学的基本物理，理解无线电波束如何反射、折射，如何处理不同的环境，理解波束成形的物理原理。

然而，当你运营网络时，你只是试图以更低的能耗、更高的吞吐量、更低的成本提供更好的服务质量。因此，你不需要实时进行基础物理模拟，只需使用 AI 来完成。这种通过理解第一性原理进行模拟，然后使用 AI 来模拟这种基础理解的原则，可以极大地减少能源消耗。

人们需要意识到，训练模型确实需要大量能源。然而，目标不是训练模型，目标是使用模型，这将节省大量能源。