近期,
除了文字渲染,GPT Image2在理解世界知识和指令遵循方面也达到了新高度。由中科大博士Jianfeng Wang负责的这一模块,解决了生图AI长期以来的痛点——例如,过去模型画的时钟几乎永远停在10:10,而新模型已能精准理解任意时间点及复杂的空间布局指令。他表示,该模型正在消除用户的创作意图与最终产出之间的鸿沟。
在生产力工具化方面,来自浙大竺可桢学院的Yuguang Yang演示了将长篇论文一键转化为高精度PPT和信息图表的能力。这得益于团队在多模态理解、MoE(混合专家模型)架构以及长程引导技术上的深度融合。
从最初的DALL-E到如今的GPT Image2,这支平均年龄极轻、背景多元的团队(包含多位2025年刚毕业的博士)完成了从“画得出”到“画得准”的进化。目前,团队成员纷纷将社交头像换成了极简的日系贴纸风格。这种带有几分戏谑色彩的自嘲,或许正是这群信奉“涌现式研究”的天才们改变世界的一种独特方式。
发表评论取消回复