声明:本文来自于微信公众号 作者:机器之心,授权靠谱客转载发布。

在一些悲观者看来,人工智能的发展似乎变慢了。

2022年底,ChatGPT 发布,五天用户注册超过百万,两个月后月活用户超过1亿,以此为起点,几乎每家科技大公司都卷入这场生成式 AI 的风暴当中,几乎每个科技创业者也都试图寻找起飞的机会,半年融资两轮、一年估值破10亿美元的 “黄金时代” 似乎又回来了,a16z 创始人 Marc Andreessen2011年提出「软件在蚕食世界」(Software is eating the world),在2023年,大家谈论的话题变成了「人工智能蚕食世界」(AI is eating the world)。

然而,等到2024年,世界似乎依然是那个世界,我们的日常生活几乎没有因为人工智能发生任何变化,应用层面的 “iPhone 时刻” 始终只出现在各类演讲里,而非我们的手头上。

在技术端,大模型本身的能力也出现了诸多问题,GPT5.0迟迟未能发布,这让大家疑惑 Scaling Law 曲线是否正在放缓,进而质疑 Transformer 架构本身的潜力;大模型的「幻觉问题」也始终影响应用层面的落地,甚至有论文认为经过校准的语言模型必然会出现幻觉,与数据质量或者算法架构本身无关 —— 换言之,这几乎是个不可能解决的问题。

乐观者则认为,这些只是当技术爆炸真正进入日常世界时候,必然出现的缓冲期。

技术爆发时候,我们往往过于兴奋,以为未来正加速到来,不过,世界本身有自己的运作规律,需要基础设施来承接,需要应用层面来落地,甚至需要法律、道德和伦理层面做好更多准备。在外滩大会上,他们为自己的乐观能够找到充足的理由。

九月初,外滩大会在上海举办,上海黄浦世博园区也成了看见 AI 未来趋势的最重要窗口。有人在讨论它是否能够疏解孤独,也有人在讨论能否帮助缓解全球变暖,在展区里,依然有着众多带着创造力的人,来展示他们用 AI 设想的未来。我们对 AI 的悲观或者乐观,背后都隐含着我们对它的期待。

每个问题都是 AI 继续进化的契机。在外滩大会上,我们能够看到人工智能依然在发展,在论坛的讨论里,在每个展厅里,我们能够看到五年后 AI 的样貌。

ai chatgpt 人工智能

「算力军备竞赛」可能不会结束,但平衡成本和提升效率越发重要

2020年,OpenAI 在一篇论文里提出 Scaling law,大意是大模型的性能与模型的具体结构 —— 深度、宽度和层数 —— 基本无关,主要由计算量、模型参数量和训练数据量三者的大小有关。

这一论断被称为 AI 领域的「摩尔定律」,也因为 OpenAI 的成功而成了很多从业者信奉的圭臬。在这一信念指引下,大模型的发展向着大算力、大参数和大数据的方向发展。先前的 AI 发展主要基于对各类模型的优化,而 Scaling Law 代表着一种新的范式:倘若有足够大的算力和数据,我们便能够解决人工智能发展的问题。

算力军备竞赛也由此开始。李飞飞团队新近发布的《人工智能指数报告》显示,最新人工智能模型的训练成本已经达到历史新高。GPT-4的训练过程耗费了约7800万美元的计算资源,谷歌的 Gemini Ultra 模型的训练成本更是高达1.91亿美元。微软也启动「星际之门」超级计算机计划,预计投资将达到1150亿美元,而谷歌也迅速表示将在算力方面有更慷慨的投资。

烽火燃不息,倘若我们想要发展更好的大模型,在技术上继续有所突破,那么这场军备竞赛便不可能结束。不过,倘若目标是应用落地和商业闭环,那么落地部署的效率和成本与技术本身一样重要。于是,优化算力效率,提高数据质量,成了各个企业关注的焦点。

企业需要关注如何通过技术创新来实现算力的经济实用,以在不牺牲性能的情况下,控制投入成本,而异构计算是实现这一目标的关键技术之一。

异构计算是一种将不同类型和架构的计算单元,如 CPU、GPU、DSP、ASIC、FPGA 等,整合到一个系统中以提高计算性能和能效的技术,能够同时处理多种类型的计算任务,如图形处理、科学计算和 AI 推理,这使得它们非常适合现代数据中心和 AI 应用的需求。

异构计算优势明显。它可以协同多种计算单元,显著提高处理速度和系统吞吐量,尤其适用于大规模并行计算任务,并能将任务分配给最适合的计算单元执行,可以优化能源利用效率,降低数据中心的能耗。同时,异构计算支持灵活的硬件配置和软件编程,能够根据需求轻松扩展系统能力,开发者也能够根据算法需求选择最合适的硬件平台。

未来五年,异构计算需要逐步解决现有的问题,才能走向普及。异构计算需要开发者具备跨平台的编程和优化技能,缺乏统一的编程框架和标准,增加了开发难度,导致开发效率受限。此外,虽然长期来看成本更低,但初期硬件投资和研发成本相比现有成熟方案依然很高,需要大公司率先投入,促进应用。

比起大模型,小模型更可能诞生「大应用」

大约十五年前,移动互联网开始繁荣,也迎来了创业的黄金时代。与之相比,AI 时代创业更加艰难,首先因为成本更高,需要算力、数据、电力等外界条件,训练大模型所需要的资金,几乎没有草根创业者能够负担。在大模型领域,很可能会出现「赢家通吃」,最终只剩下几个主要的模型厂商。

不过,AI 是个庞大的生态,在算法、算力、数据和系统等领域都有着大量机会。

在外滩大会上,一个被讨论很多的机会是数据服务商。AI 大模型的性能在很大程度上取决于训练数据的规模和质量。数据数量的增加可以提供更多的样本,使模型能够学习到更多的特征和模式。如今 AI 发展的重要瓶颈,是现实世界的数据接近枯竭,而合成数据依然存在着很多问题,比如无法反映物理世界的复杂情况等。

于是,一批新型的数据服务商便可能成为 AI 时代的「卖水人」。它需要以更高的效率完成包括数据清洗、数据标注、数据整合和数据安全措施等方面的工作,确保数据的来源可靠、处理过程透明和结果可验证。高质量的数据为 AI 模型提供学习的基础,从而形成数据飞轮,推动其不断进化和改进。

更大的创业机会在应用端,尤其是在行业领域。不过,通往行业落地的大门可能并非大模型,而是小模型 / 端侧模型。

严格来说,「小模型」与「端侧模型」并不等同。小模型通常指的是参数规模远少于 GPT-3或 Llama-13B 的大语言模型,如1.5B、3B、7B 等;「端智能」则指的是部署在手机、电脑等用户设备上的模型,通常计算资源受限,无法直接运行大模型,于是也要特别设计新的模型。二者目标不同,不过终端设备能够流畅运行的,往往都是小模型,因此存在很多重合,我们也不做细致的区分。

小模型虽然参数规模小,不过往往专注于某一领域和任务的设计和优化,在这些方面可以达到甚至超过大模型的性能,如 Mistral-7B 模型在某些基准测试中超越了参数量更大的模型,显示出小模型在特定任务上的优势。

因为算力和能源消耗低,小模型更适合落地应用。在端侧,苹果在 iPhone 上使用的 DCLM 模型参数量为70亿。傅盛也曾提到,企业专用模型大概只需要百亿参数 —— 作为对比,GPT4的参数量高达1.7万亿。

小模型的发展将带来端智能的普及,未来五年率先落地的可能是一批「博士」水平的专业 AI。外滩大会上已经能看到不少很有潜质的产品雏形,涉及医疗、能源、教育等领域。借助这些专门化的 AI 工具,企业可以更容易地将 AI 技术集合到业务流程中,在行业中落地应用。

行业侧的落地应用也将有助于 AI 本身的进化。各个领域存在大量数据,在利用 AI 优化决策、提高效率的同时,AI 也能获得更高质量的数据,模型和算法也会不断演进与改变,从而推动整个人工智能领域的发展与成熟。

端智能可能是大模型的终局,但手机智能未必是

如今提到端侧模型,往往指的是手机,因为这是我们随手可触及的算力最强的设备,不过,手机可能只是端智能的过渡阶段。

手机智能的瓶颈很明显,首先是算力不足,但更重要的可能是内存不足。相比云端服务器,手机等设备的内存容量和存储空间都要小很多,但即便是小模型依然需要占用大量空间。

内存之外,能源和功耗问题也是一个问题。AI 计算过程功耗巨大,很容易导致电池电量不足,设备发热,甚至影响系统总体稳定性。

现在的解决方案一方面是提升手机性能,一方面则是设计更小的模型,以确保在有限的内存、算力、功耗限制下高效运行,如苹果便从0构建了专门的小模型,而非对现有的大模型来裁剪。

不过,长期来看,或许我们会有新的 AI Agent,成为人工智能时代下的新型终端形态。

我们期待的 AI Agent 并非简单地执行指令,而更像是具身智能理念在人工智能领域的具体体现,具有更高级别的自主性和智能,是能够在环境中自主行动、感知并做出决策的智能实体。

这意味着,AI Agent 不仅能够处理虚拟任务,还能够在物理世界中执行动作,提供更加丰富和直观的用户体验。这种结合也推动了人工智能在多个领域的创新应用,如自动驾驶汽车、智能家居、工业自动化等。

我们与 AI Agent 的交互方式也将发生新的变化。从早期的机器语言到图形用户界面(GUI)、手势控制,再到现在的全模态自然语言交互,人机交互的方式不断演进。全模态交互意味着机器可以通过多种方式(如语音、视觉、触觉等)理解和响应人类的指令,使得交互更加自然和直观。

随着交互方式的演进,机器不再仅仅是工具,而是能够提供陪伴、协助和情感支持的伙伴;应用入口也不再局限于传统的操作系统或应用程序界面,而是可以通过多种设备和场景进行交互。

这或许不会在5年的时间里发生,不过三到五年之后,更多人会拥有可以支持端侧模型的手机,一批 AI 应用也将全面落地,AI 也将真正跨越鸿沟,走向生活。在这之后,新型终端形态也将走出原型阶段,拥有早期使用者,为进一步普及打下基础。

结语

在瓦特之前半个世纪,蒸汽机技术和相关理论已经成熟,然而瓦特让蒸汽机终于能够在生产中使用,并且将它推广到了市场上。即便如此,又过了近半个世纪,蒸汽机在纺织厂普及,蒸汽轮船也开始成为河运主力,蒸汽机才真正「蚕食世界」。

当下时代,技术传播与发展的时间周期大大缩短,但我们依然需要经历每个阶段。过去两年里,我们见证了 AI 技术的爆发,未来五年,或许正式找到属于 AI 的纺织厂和蒸汽轮船的时候。

iPhone 在美国诞生,不过移动互联网最繁荣的市场之一是中国。或许未来五年,我们也能看到更多 AI 应用和场景的爆发,形成繁荣的中国 AI 应用生态。

(举报)

点赞(47)

评论列表共有 0 条评论

立即
投稿
返回
顶部