声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:月山橘,授权靠谱客转载发布。

自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗?

是的,还没有,但应该快了。

图片

不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点了最近GPT-4o的十大创意玩法,一起来看看网友们都用GPT-4o解锁了什么新体验。

省流版:有了GPT-4o,就相当于有了一个行走的挑水果专家、一个AI股神、一个私人医生、一个家庭教师、一个精通各国语言的旅游搭子、一个平面设计/3D建模/编程助手……

水果摊杀手

每次挑西瓜都像在开盲盒,经常挑到皮厚的大水瓜?有网友试着让GPT-4o来帮忙。

先给西瓜拍照并给每个西瓜标上序号,然后把照片发给GPT-4o,让它帮忙分析和Pick。

没想到,GPT-4o还真有两把刷子,挑的西瓜薄皮沙瓤。

图片

不过也有网友表示:“有没有一种可能是季节到了,个个包甜?”

如果说西瓜甜与否,无法直观呈现,但榴莲好坏可以。这不,即刻网友“AIchian花生”就把挑榴莲的重任交给了GPT-4o,不仅成功避坑一个坏榴莲,还选中一个5房的干包黄肉。

图片

私人医生

如果挑水果是小case,那看牙片属实有点上难度了。

有网友把自己的牙片发给GPT-4o,让它帮忙看看自己的牙有什么问题,没想到它不仅能看懂,而且分析得头头是道。

图片

你还可以把每顿饭拍照发给它,让它测算总体的热量和营养,搭配膳食:

图片

图片

其实对于诸如挑水果、估算食物热量等简单需求,其他具备多模态能力的AI模型也可以满足,不过在处理和分析稍复杂的图像时,GPT-4o的表现通常更好。

AI股神巴菲特

之前有研究称“GPT-4选股准确率高达60%”,没想到GPT-4o更上一层楼。

X网友“Jerlin”用GPT-4o将两百多行选股指标改写成了自动选股器,并输出图表,归档数据,经过一轮细节修改就完成了。

图片

相比之下,用GPT-4选股多少有点古法炼钢了。

“Jerlin”称,如果用GPT-4需要反复修改,100行以上的代码处理起来非常低效,GPT-4o的效率堪称“暴打GPT-4”。

最关键的是,它选的股好像真能带来收益(当然了这里还是要提醒下炒股有风险投资需谨慎)。

图片

图源X@Jerlin

除了荐股之外,给GPT-4o一张股票图表,它的分析能具体到买点、卖点、止损点位、价格上的形态结构。

图片

旅游随行翻译+向导

这可能是手机自带翻译被黑得最惨的一次。

图片

再来看看GPT-4o翻译的:

图片

上个月,“头号AI玩家”编辑部去日本团建了几天,真切感受到GPT-4o简直妥妥的随行翻译+向导。

点餐翻译菜单、买药妆翻译产品说明、介绍景点……统统不在话下。

图片

图片

总之,你能想象到的任何需要翻译的场景,用GPT-4o大概率会获得比其他翻译软件更地道、精准的翻译。

图片

图片

自动化生成游戏

众所周知,游戏是AI最佳的试验场之一。

通过读取屏幕上的网页截图,GPT-4o在一分钟之内就生成了一个游戏,并且代码一遍过,没有Bug,十分流畅和还原。

还有网友用GPT-4o和Midjourney写了一个全新UI的俄罗斯方块游戏,直接展示下成品:

对于开发者而言,自动化生成游戏可以大幅减少开发时间和成本,能够快速测试和迭代新想法。

而对于不懂编程的普通用户而言,想象一下,AI可以根据你的喜好和要求,自动生成一款个性化游戏,是不是还挺有意思的。不过,目前AI生成的游戏往往需要额外的人工干预,以确保游戏的质量、平衡性和可玩性。

自动化生成网站

一张网页截图就能复制网站,前端不知是喜还是忧。

X网友“Sawyer Hood”发给GPT-4o一张Facebook Messenger的聊天界面截图,让它制作成单个HTML文件,GPT-4o只用6秒就完成了。

不到一分钟的时间,GPT-4o就把纸上的草图变成了一个可以运行的应用程序:

X网友“yancymin”把GPT-4o接入Figma,使用GPT-4o实时生成UI界面和原型。虽然生成的界面在视觉和细节上不够完善,但在界面逻辑上表现得十分优秀,且生成的内容可以编辑,并支持自适应拉伸。不过,目前此插件还在测试中,并未对外开放。

图片

虽然市面上已有很多类似应用和工作流,比如用AI生成设计图,复制到Figma,再用插件生成对应框架代码。不过接入GPT-4o,显然语义理解能力更强,出图逻辑也更合理。

Code C opilot

“Talk is cheap, show me the code.”

这是程序猿间广为流传的一句diss用语,强调的是实际编写代码和解决问题的能力比单纯的讨论和理论更加重要,这在让AI生成代码方面同样适用

按照以往的逻辑,需要通过一步步引导ChatGPT,才能产出符合要求的代码,过程中通常还需要反复修改、测试。

但小红书网友“Bisgates”犯懒,把整个问题抛给了GPT-4o,本来不抱希望,没想到它竟一次性给出了所有代码,而且一点问题都没有,可以直接训练,结果也完全准确。

图片

图片

还有网友横向测试了多个AI大模型发现,只要是稍微复杂点的需求,除GPT-4o以外的其他大模型就会错误百出,对话十几次甚至几十次,依然不能给出完全正确的vba代码。

平面设计/3D建模

在平面设计领域,GPT-4o也不遑多让。

比如将完全不相关的两张照片融合到一起,创造出全新的概念和视觉效果:

图片

在3D建模方面,只需要用自然语言描述需求,GPT-4o就可以直接生成stl模型,并能导入到SketchUp中。

图片

它还能够将2D图像转化为3D模型,比如将OpenAI标志进行3D重建,效果流畅自然。

你是我的眼

林宥嘉有首歌叫《你是我的眼》,歌词描绘了一个先天性失明盲人的所想所念。

GPT-4o正在将这首歌的寄望变成现实。

视频中,一位视障人士所到之处,GPT-4o都可以通过摄像头实时告诉他周围的环境和风景。甚至可以在当有出租车出现时,提醒他招手示意。

这种通过摄像头进行实时语音交互的能力,不禁让人想起十多年前Google Glass的冤魂,感觉挖出来还能抢救一下。

家庭教师

家庭教师危。

在OpenAI放出的官方演示中,GPT-4o可以通过读取iPad屏幕内容,辅导孩子做几何数学题。旁边的家长在一开始告诉GPT-4o不要直接说出答案,而是通过引导他儿子一步一步地解。

然后GPT-4o用实力演绎了什么叫做“循循善诱”和鼓励式教育,一步一步教导他儿子解出了这道数学题,并且讲解得非常细致。

他儿子每完成一步,GPT-4o在语气上都会有一种更振奋和鼓舞的感觉。

这交互、这专业度和反应速度,真的还有必要花钱请家教吗?

值得一提的是,谷歌发布多模态大模型Gemini时,也做过类似的实时交互演示,但后来被曝是后期剪辑而成的效果

告诉GPT-4o你想学西班牙语,然后指着桌上的苹果用英语问“这是什么?”,它可以心领神会地用英语和西班牙语组合输出。

还有网友挑战说中式英语,看GPT-4o如何纠正他。

可以看到,GPT-4o可以非常流畅地使用中英文来纠正他的非正式英语,并告诉他正确的表达。

其实,类似的英语口语陪练应用/Agent有很多,比如Call Annie、Character.ai、豆包等,但GPT-4o的优势在于几乎零延迟和情感化交互,以及共享屏幕。

就在前几天,OpenAI推出了专为大学设计的ChatGPT Edu版本,搭载GPT-4o,具备联网搜索、自定义GPT、数据分析、代码生成等功能。教育行业或将迎来一场深刻的教育模式变革。

从家庭教师到私人医生,从旅游翻译到Code C opilot,GPT-4o在多个领域的创意应用,让我们对AI的潜力有了更深的认识和期待。

随着AI技术的快速进步与普及,我们或将见证人工智能以前所未有的方式融入并彻底改变我们的日常生活。

(举报)

点赞(62)

评论列表共有 0 条评论

立即
投稿
返回
顶部