4月1日,阿里巴巴集团正式推出新一代图像生成与编辑模型“Wan2.7-Image”。该模型旨在解决当前数字图像生成领域普遍存在的生成结果同质化、色彩控制不精准等问题。
据悉,新模型能够实现高度个性化的人物形象生成,并提供了全新的色彩管理工具,使用户能够对生成图像的色彩构成进行精确调控。
目前,用户已可通过阿里云官方指定平台体验该模型的核心功能,相关移动端应用也将于近期完成接入。
“Wan2.7-Image”集成了从文本生成图像、基于图像生成系列图、图像指令编辑到交互式编辑在内的完整功能链。在近期进行的独立评估中,其文本生成图像的质量在多项关键指标上表现突出,尤其在文本渲染准确度与成像真实感方面达到了行业先进水平。
模型演示图:个性化形象生成效果
针对图像生成中人物面貌趋同的现象,该模型增强了细节定制能力。用户可通过调整包括脸型、眼部特征在内的多项参数,生成具有不同面部特征的人物形象,有效提升了生成结果的多样性。
不同参数设定下生成的面部特征对比
此外,模型新增的“调色盘”功能支持用户通过色值代码提取或定义颜色方案,并可自由调整画面中不同颜色的比例,实现了对生成作品色彩风格的直接控制。
色彩自定义功能界面示意
在文字与复杂内容渲染方面,该模型展现出显著优势。它能够高精度地处理包含长篇幅文字、表格及复杂公式的内容,支持多种语言输入,可生成适用于印刷品级别的图像,满足学术出版等专业场景的需求。
该模型还具备高效的组图生成能力,可一次性生成多张风格统一的图像,适用于制作系列海报、演示文稿配图、产品多视角展示图及分镜脚本等批量创作任务。
在多主体图像生成中,模型能有效保持输入参考图像间的风格与特征一致性,为合影制作、系列海报设计等需要统一视觉风格的创作提供了便利。
技术层面,该模型基于大规模、多品类的视觉数据进行训练,并采用了融合生成与理解的统一架构。研发团队通过对图像布局、文字、光影等多维度信息进行精细化标注,提升了模型对创作意图的准确理解能力。
同时,性能更强的“Wan2.7-Image-Pro”版本也已上线,在图像构图稳定性与语义理解精准度上进行了进一步优化。
在应用前景方面,该模型预计将对多个行业产生积极影响。影视制作团队可将其用于角色概念设计与视觉预览;内容创作者可快速生成风格化配图;电商领域则能借此降低产品展示图的拍摄成本;教育与科研人员也可利用其高效生成论文插图与信息图表。
为拓展应用边界,该模型现已支持通过特定指令调用扩展功能,探索更广泛的创意生成场景。
(举报)
- 相关推荐
-
荐AI日报:谷歌发布Veo3.1Lite;ClawHub 推出官方中国镜像站;阿里Wan2.7-Image发布
本期AI日报聚焦多领域进展:谷歌发布Veo 3.1 Lite视频生成模型,成本降超50%;阿里推出Wan2.7-Image大模型,支持像素级“捏脸”与个性化创作;ClawHub上线中国镜像站,加速AI Agent开发;字节跳动启动Seed 2027校园招聘,培养大模型人才;高德开源机器人基座模型ABot-M0,推动具身智能发展;OpenAI适配苹果CarPlay,支持语音交互;Anthropic因疏忽致Claude Code源码泄露,引发安全关注。
-
荐AI日报:阿里发布Wan2.7视频模型;红果下架AI剧桃花簪;广电严禁AI演员换脸
本期AI日报聚焦多领域进展:阿里通义实验室发布Wan2.7-Video模型,提升视频创作自由度;红果短剧因AI换脸侵权下架,引发行业法律风险讨论;腾讯云推出“龙虾”记忆服务,增强AI代理长期记忆能力;千问3.6发布,编程能力达国际先进水平;广电行业组织严禁AI换脸和声音克隆侵权;ElevenLabs进军AI音乐创作市场;谷歌开源Gemma4模型;小米MiMo大模型推出商业化订阅套餐。
-
阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路
阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。
-
荐AI日报:Luma AI发布Uni-1图像模型;阿里达摩院发布玄铁C950;美团龙猫发布开源数学定理证明模型
本期AI日报聚焦多项技术突破:Luma AI发布Uni-1图像模型,支持文本与像素同步生成;美团开源数学定理证明模型LongCat-Flash-Prover;阿里玄铁C950处理器刷新RISC-V性能纪录;iPhone 17 Pro成功本地运行4000亿参数大模型;Claude助手升级,可控制用户电脑;西湖大学发布全球首个机器人“通用小脑”泰坦o1;OpenAI申请将ChatGPT纳入安卓默认搜索引擎选项;国家数据局正式将“Token”定名为“词元”,规范大模型术语标准。
-
技嘉AI TOP ATOM携手AIMA打造桌面级AI落地新范式
在大模型应用持续走向落地的背景下,桌面级AI设备正在从“能跑模型”走向“真正可用”。围绕开发者、研究人员、小型团队以及对本地部署有需求的用户,技嘉AI TOP ATOM正尝试提供一种更贴近实际使用场景的桌面级AI解决方案。根据最新统计数据,中国软件开发者数量突破940万,其中涉及 AI 开发的开发者超过200万,说明中国AI市场对本地化部署、数据安全可控、低门槛使用�
-
荐AI日报:MiniMax发布M2.7模型;腾讯QClaw接入微信小程序;OpenAI发布最强小模型GPT-5.4 mini
本期AI日报聚焦行业动态:MiniMax发布首个深度自我迭代国产大模型M2.7,具备强大自主构建能力。腾讯云AI智能体QClaw接入微信小程序,强化文件互传与多模态交互。OpenAI推出高性能小模型GPT-5.4 mini与nano,专为高频低延迟场景设计。AI演员应用引热议,导演于正称其无法替代真人情感表达。Unsloth Studio发布首个本地可视化大模型微调平台,显存占用降低70%。灵光“代搭应用”服务兴起,降低AI应用开发门槛。阿里云宣布AI算力与存储产品涨价,最高涨幅34%。字节跳动发布ByteClaw工具及《安全规范》,强化大模型内网访问管控。
-
谷歌发布Gemma 4大模型:31B登顶开源第三!手机可离线运行
今天凌晨,谷歌DeepMind正式推出新一代开源大模型Gemma 4,该模型与谷歌闭源旗舰Gemini共享底层技术,也是时隔一年对Gemma 3的重大升级。 此次谷歌一改此前自有协议,采用Apache 2.0商业友好型许可证开源,开发者可无门槛自由修改、分发和商用。 一口气推出四款不同规格模型,覆盖从手机、边缘设备到工作站、服务器的全场景部署,在参数效率上表现亮眼,31B版本更是跻身Arena
-
大模型吞噬阴影下,美图交出“十年最强”成绩单
文章探讨了“AI吞噬软件”论调对全球软件市场的冲击,指出并非所有软件都将被取代。以美图为代表的审美决策类应用,因其核心在于满足用户主观审美和创作需求,而非标准化流程,反而通过整合AI能力实现业绩增长。文章认为,AI可能替代流程优化类软件,但难以颠覆需要人类审美决策的应用。未来,AI不会毁灭软件行业,而是成为一道分水岭,区分“AI受害者”与“AI受益者”。美图等公司通过主动变革,将Agent能力整合至产品,聚焦高价值垂直场景,展现了在AI时代的进化与价值。
-
华为最强旗舰来了!Pura 90 Pro系列影像大升级:潜望长焦有点夸张
华为将于本月正式推出全新Pura 90系列,包括标准版、Pro版及Pro+版三款机型。该系列以潜望式长焦镜头为核心卖点,其中Pura 90 Pro系列将配备高达2亿像素的超级潜望长焦,大幅提升远距离拍摄的细节解析力。新机在Pura 80系列一镜双焦段技术基础上,对影像系统进行全方位深度优化,并搭载性能更强的麒麟9030 Pro芯片,为复杂AI影像算法提供充足算力。综合来看,Pura 90系列有望成为华为影像实力最强的旗舰产品,值得追求极致移动摄影体验的用户期待。
-
智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码
智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。
今日大家都在搜的词:
- 人生重开模拟器
- 显卡天梯图
- 国内云服务器哪家好
- 高通骁龙处理器排名
- 手机CPU天梯图
- 单反相机天梯图
- 安兔兔手机跑分排行榜
- 笔记本电脑排行榜
发表评论取消回复