雷军“怒骂”全国网友七天！AI彻底变坏了？恶搞雷军，AI语音方向错了?AI语音被滥用，如何防诈成关键写在最后

2024-10-10 12:12 278 阅读 0 评论 184 点赞

声明:本文来自于微信公众号雷科技，作者:雷科技，授权热心网友转载发布。

谁能想到科技圈顶流之一的雷军，居然因为AI语音引起互联网热议?

国庆期间，小雷的抖音首页几乎被雷军的AI语音包刷屏。视频中的“雷军”用熟悉的口音带着些许不耐烦的语气，戏谑地吐槽:“这游戏做成这样，绝对是来捣乱的!”由于这些用词与雷军本人十分相似，评论区也常有人问到:“这真是雷军本人说的吗?”

（图源:抖音）

因神似雷军说话的语气和口音，这些语音包已经在短视频平台迅速走红。但随着这股雷军AI语音热潮席卷网络，除了给网友们带来欢乐，也掀起了更深层次的讨论。AI语音技术的快速发展正深刻地改变着我们的生活，而它的滥用则让我们意识到，这项技术带来的不只是便利，还有潜在的风险:如果雷军的声音可以如此轻松地被复制和恶搞，那在生活中，其他人的声音是否也会面临相同的风险呢?

恶搞雷军，

AI语音方向错了?

实际上，在雷军AI语音出圈之前，已经有不少明星“中招”。去年末，美国某知名歌手AI语音视频频频出圈，视频中的她不仅能说这一口流利的中文，甚至还发表了一些政治倾向明显的言论，引起巨大争议。该名歌手的团队也在了解此事后迅速发文澄清，但已经有不少网友信以为真，造成了影响。

作为当代最快实现普适化的AI技术之一，AI语音其实在我们生活中已经相当流行，例如抖音早早就推出了AI配音功能，让创作者可以输入一段文字后使用AI进行语音生成，还能模仿不同的口音，不同的人物角色语气等。

（图源:剪映）

AI语音主要分为5种模式，分别是语音合成、语音克隆、语音识别、深度伪造和自然语言处理。大多数创作者在伪造名人AI语音时，都会使用多种模式进行炮制，比如雷军的AI语音包，显然使用了语音合成、语音克隆、深度伪造音频以及自然语言处理的结合。这些技术共同作用，使得AI生成的语音能够高度逼真地模仿雷军的声音和语气，为用户提供了一种“真假难辨”的体验。

当然，假如AI语音合成仅仅停留在恶搞的层面上，或许还不至于让网友们开始担忧这项技术的安全性。根据美国联邦贸易委员会（FTC）的数据，2022年因亲友冒充诈骗导致的损失高达2.6亿美元，其中很多案件使用了AI语音克隆技术。诈骗者通常只需几秒钟的语音片段，就能轻松模仿受害者亲友的声音，发起“紧急求助”的诈骗。这类骗局在美国、英国和印度等地频发，且常以老人和年轻人作为目标，让人防不胜防。

AI语音之所以能够快速席卷全球，并被不法分子利用到行骗当中，其实与其发展势头过猛也脱不开关系。比如专注于AI语音技术研究的ElevenLabs，在前两年就开发出了通过卷积神经网络（CNN）和循环神经网络(RNN)，平台能够识别和模仿独特的发音模式，并复现这些特征，适用于个性化内容制作，例如创建定制的虚拟助手声音的技术。