4月15日,据相关消息,阿里ATH创新事业部研发的视频生成系统“快乐马1.0”已启动小范围测试,目前正进行发布前的最终调试。
据悉,该系统在视频编辑功能上展现出较强能力,预计将于近期完成版本更新并正式对外发布。
根据安排,其应用程序接口计划于4月30日对外开放。目前已有部分用户受邀参与前期体验,以协助完善产品功能。
值得注意的是,该系统此前曾以匿名方式参与国际视频生成平台Artificial Analysis Video Arena的盲测评估,在根据文字或图片生成视频的测试中,其综合表现超过了包括字节跳动Seedance 2.0及快手可灵3.0在内的多个同类产品,位列榜首。
技术资料显示,该系统基于大规模参数的单流Transformer架构构建,能够同步生成视频画面与对应音频。
与通常需要分步处理画面、音频再进行合成的技术方案不同,该系统将音视频生成整合于单一流程,可一次性输出带声音的完整视频片段,简化了后期处理步骤。
此外,该系统已实现对英语、普通话、粤语、日语、韩语、德语及法语共七种语言的唇形同步生成支持。
(举报)
发表评论取消回复