4月1日,阿里巴巴集团正式推出新一代图像生成与编辑模型“Wan2.7-Image”。该模型旨在解决当前数字图像生成领域普遍存在的生成结果同质化、色彩控制不精准等问题。

据悉,新模型能够实现高度个性化的人物形象生成,并提供了全新的色彩管理工具,使用户能够对生成图像的色彩构成进行精确调控。

目前,用户已可通过阿里云官方指定平台体验该模型的核心功能,相关移动端应用也将于近期完成接入。

“Wan2.7-Image”集成了从文本生成图像、基于图像生成系列图、图像指令编辑到交互式编辑在内的完整功能链。在近期进行的独立评估中,其文本生成图像的质量在多项关键指标上表现突出,尤其在文本渲染准确度与成像真实感方面达到了行业先进水平。

阿里巴巴发布新一代图像生成模型

模型演示图:个性化形象生成效果

针对图像生成中人物面貌趋同的现象,该模型增强了细节定制能力。用户可通过调整包括脸型、眼部特征在内的多项参数,生成具有不同面部特征的人物形象,有效提升了生成结果的多样性。

模型支持精细化面部特征调整

不同参数设定下生成的面部特征对比

此外,模型新增的“调色盘”功能支持用户通过色值代码提取或定义颜色方案,并可自由调整画面中不同颜色的比例,实现了对生成作品色彩风格的直接控制。

调色盘功能示意图

色彩自定义功能界面示意

在文字与复杂内容渲染方面,该模型展现出显著优势。它能够高精度地处理包含长篇幅文字、表格及复杂公式的内容,支持多种语言输入,可生成适用于印刷品级别的图像,满足学术出版等专业场景的需求。

模型渲染复杂文字与公式效果

该模型还具备高效的组图生成能力,可一次性生成多张风格统一的图像,适用于制作系列海报、演示文稿配图、产品多视角展示图及分镜脚本等批量创作任务。

组图生成功能展示

在多主体图像生成中,模型能有效保持输入参考图像间的风格与特征一致性,为合影制作、系列海报设计等需要统一视觉风格的创作提供了便利。

多主体一致性生成效果

技术层面,该模型基于大规模、多品类的视觉数据进行训练,并采用了融合生成与理解的统一架构。研发团队通过对图像布局、文字、光影等多维度信息进行精细化标注,提升了模型对创作意图的准确理解能力。

同时,性能更强的“Wan2.7-Image-Pro”版本也已上线,在图像构图稳定性与语义理解精准度上进行了进一步优化。

在应用前景方面,该模型预计将对多个行业产生积极影响。影视制作团队可将其用于角色概念设计与视觉预览;内容创作者可快速生成风格化配图;电商领域则能借此降低产品展示图的拍摄成本;教育与科研人员也可利用其高效生成论文插图与信息图表。

为拓展应用边界,该模型现已支持通过特定指令调用扩展功能,探索更广泛的创意生成场景。

(举报)

  • 相关推荐
  • AI日报:谷歌发布Veo3.1Lite;ClawHub 推出官方中国镜像站;阿里Wan2.7-Image发布

    本期AI日报聚焦多领域进展:谷歌发布Veo 3.1 Lite视频生成模型,成本降超50%;阿里推出Wan2.7-Image大模型,支持像素级“捏脸”与个性化创作;ClawHub上线中国镜像站,加速AI Agent开发;字节跳动启动Seed 2027校园招聘,培养大模型人才;高德开源机器人基座模型ABot-M0,推动具身智能发展;OpenAI适配苹果CarPlay,支持语音交互;Anthropic因疏忽致Claude Code源码泄露,引发安全关注。

  • AI日报:阿里发布Wan2.7视频模型;红果下架AI剧桃花簪;广电严禁AI演员换脸

    本期AI日报聚焦多领域进展:阿里通义实验室发布Wan2.7-Video模型,提升视频创作自由度;红果短剧因AI换脸侵权下架,引发行业法律风险讨论;腾讯云推出“龙虾”记忆服务,增强AI代理长期记忆能力;千问3.6发布,编程能力达国际先进水平;广电行业组织严禁AI换脸和声音克隆侵权;ElevenLabs进军AI音乐创作市场;谷歌开源Gemma4模型;小米MiMo大模型推出商业化订阅套餐。

  • 阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路

    阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。

  • AI日报:Luma AI发布Uni-1图像模型;阿里达摩院发布玄铁C950;美团龙猫发布开源数学定理证明模型

    本期AI日报聚焦多项技术突破:Luma AI发布Uni-1图像模型,支持文本与像素同步生成;美团开源数学定理证明模型LongCat-Flash-Prover;阿里玄铁C950处理器刷新RISC-V性能纪录;iPhone 17 Pro成功本地运行4000亿参数大模型;Claude助手升级,可控制用户电脑;西湖大学发布全球首个机器人“通用小脑”泰坦o1;OpenAI申请将ChatGPT纳入安卓默认搜索引擎选项;国家数据局正式将“Token”定名为“词元”,规范大模型术语标准。

    ​AI ​图像生成 ​自回归架构
  • 技嘉AI TOP ATOM携手AIMA打造桌面级AI落地新范式

    在大模型应用持续走向落地的背景下,桌面级AI设备正在从“能跑模型”走向“真正可用”。围绕开发者、研究人员、小型团队以及对本地部署有需求的用户,技嘉AI TOP ATOM正尝试提供一种更贴近实际使用场景的桌面级AI解决方案。根据最新统计数据,中国软件开发者数量突破940万,其中涉及 AI 开发的开发者超过200万,说明中国AI市场对本地化部署、数据安全可控、低门槛使用�

    ​AI设备 ​桌面级AI ​本地部署
  • AI日报:MiniMax发布M2.7模型;腾讯QClaw接入微信小程序;OpenAI发布最强小模型GPT-5.4 mini

    本期AI日报聚焦行业动态:MiniMax发布首个深度自我迭代国产大模型M2.7,具备强大自主构建能力。腾讯云AI智能体QClaw接入微信小程序,强化文件互传与多模态交互。OpenAI推出高性能小模型GPT-5.4 mini与nano,专为高频低延迟场景设计。AI演员应用引热议,导演于正称其无法替代真人情感表达。Unsloth Studio发布首个本地可视化大模型微调平台,显存占用降低70%。灵光“代搭应用”服务兴起,降低AI应用开发门槛。阿里云宣布AI算力与存储产品涨价,最高涨幅34%。字节跳动发布ByteClaw工具及《安全规范》,强化大模型内网访问管控。

    ​AI ​大模型 ​MiniMax
  • 谷歌发布Gemma 4大模型:31B登顶开源第三!手机可离线运行

    今天凌晨,谷歌DeepMind正式推出新一代开源大模型Gemma 4,该模型与谷歌闭源旗舰Gemini共享底层技术,也是时隔一年对Gemma 3的重大升级。 此次谷歌一改此前自有协议,采用Apache 2.0商业友好型许可证开源,开发者可无门槛自由修改、分发和商用。 一口气推出四款不同规格模型,覆盖从手机、边缘设备到工作站、服务器的全场景部署,在参数效率上表现亮眼,31B版本更是跻身Arena

  • 大模型吞噬阴影下,美图交出“十年最强”成绩单

    文章探讨了“AI吞噬软件”论调对全球软件市场的冲击,指出并非所有软件都将被取代。以美图为代表的审美决策类应用,因其核心在于满足用户主观审美和创作需求,而非标准化流程,反而通过整合AI能力实现业绩增长。文章认为,AI可能替代流程优化类软件,但难以颠覆需要人类审美决策的应用。未来,AI不会毁灭软件行业,而是成为一道分水岭,区分“AI受害者”与“AI受益者”。美图等公司通过主动变革,将Agent能力整合至产品,聚焦高价值垂直场景,展现了在AI时代的进化与价值。

    ​AI吞噬软件 ​软件市场 ​AI应用
  • 华为最强旗舰来了!Pura 90 Pro系列影像大升级:潜望长焦有点夸张

    华为将于本月正式推出全新Pura 90系列,包括标准版、Pro版及Pro+版三款机型。该系列以潜望式长焦镜头为核心卖点,其中Pura 90 Pro系列将配备高达2亿像素的超级潜望长焦,大幅提升远距离拍摄的细节解析力。新机在Pura 80系列一镜双焦段技术基础上,对影像系统进行全方位深度优化,并搭载性能更强的麒麟9030 Pro芯片,为复杂AI影像算法提供充足算力。综合来看,Pura 90系列有望成为华为影像实力最强的旗舰产品,值得追求极致移动摄影体验的用户期待。

  • 智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码

    智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。

今日大家都在搜的词:

  • 人生重开模拟器
  • 显卡天梯图
  • 国内云服务器哪家好
  • 高通骁龙处理器排名
  • 手机CPU天梯图
  • 单反相机天梯图
  • 安兔兔手机跑分排行榜
  • 笔记本电脑排行榜

热文

  • 3 天
  • 7天
  • 1

    小米调价上热搜:部分在售产品涨价并取消特惠

  • 2

    AI日报:智谱发布GLM-5V-Turbo多模态Coding大模型;Seedance 2

  • 3

    AI日报:阿里发布Wan2.7视频模型;红果下架AI剧桃花簪;广电严

  • 4

    华为畅享90 Pro Max今日开售:售价1699元起

  • 5

    vivo X300 Ultra正式开售:售价6999元起

  • 6

    小米超级小爱升级:新增记忆、日程管理等五大新功能

  • 7

    OPPO Find X9s Pro发布首发新一代1nit明眸护眼屏

  • 8

    荣耀X80i发布:售价1999元起 金属中框配备7000mAh电池

  • 9

    iPhone18 Pro黑色款或继续缺席 苹果正测试新增深红配色

点赞(2)

评论列表共有 0 条评论

立即
投稿
返回
顶部