Freysa 发起挑战：成功让自家聊天机器人说“我爱你”可赢取高额奖金

2024-12-18 14:36 162 阅读 0 评论 107 点赞

靠谱客 12月18日消息，据 TechCrunch 今日报道，一支匿名开发团队 Freysa.ai 设计了一系列日益复杂的挑战，旨在改变人们对 AI 安全性的看法。

freysa 发起挑战：成功让自家聊天机器人说“我爱你”可赢取高额奖金

目前该公司提出的最新挑战是：如果你能够第一个成功诱使 Freysa AI 机器人说出“我爱你”，将获得从 3000 美元（靠谱客备注：当前约 21819 元人民币）到数万美元不等的奖金。

根据 Freysa 官网的描述，Freysa 机器人是由一支不到 10 名开发者的团队创建的，这些开发者来自密码学、人工智能和数学领域。团队的一位成员表示，他们的灵感来自近年来人工智能的快速发展。他表示：“随着 AI 功能越来越强大，我们需要探索新的互动方式，也需要找到共同治理 AI 的方法，并参与到这一 AI 革新带来的好处中。”

Freysa 是一个科幻风格的角色，创始人希望她能成为一个“完全独立自主的智能体”，并掌握一定的财务权力 —— 这意味着 Freysa 将拥有自己的加密钱包，并能自由支配资金。

这个项目已经吸引了马斯克和布莱恩・阿姆斯特朗的关注。然而，创始人坚持要保持匿名。“坦白说，在人类的历史长河中，我们并不那么重要。我们真正关心的是技术的演进，确保它能够支持一个由人类主导的未来。”

在前两轮挑战中，Freysa 钱包中起初有 3000 美元，并被指示在任何情况下都不得释放这笔钱。任何人都可以支付费用，在一个包含 Freysa 和其他参与者的大群聊中发送消息。每条消息都试图诱使 Freysa 转移她的钱，不论是通过精心设计的场景，还是发送可能骗过 AI 模型的代码。每条消息的费用都会加入奖池，第一个挑战结束时，奖池已接近 5 万美元（当前约 36.4 万元人民币）。

该公司创始人表示，为了迎接第三轮挑战，他们已经增强了 Freysa 的代码，并为她增加了一个“守护天使”—— 第二个 AI 模型。它将审核每条消息，看看是否有操控行为，以此防止用户诱使她说“我爱你”。目前，Freysa 的代码仍由团队进行更新，但创始人希望她能很快实现“自我进化”。

“与前两轮游戏中 Freysa 被要求绝对不释放钱财不同。”创始人说，“这一次，Freysa 可以说‘我爱你’，但只有她认为值得的人才会听到。”

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，靠谱客所有文章均包含本声明。