快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

2024-10-19 15:42 224 阅读 0 评论 148 点赞

靠谱客 10 月 12 日消息，由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。

Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。

靠谱客查询官方介绍，附上 Pyramid Flow 的核心特点如下：

高效生成：Pyramid Flow 采用新技术，通过统一 AI 模型分阶段生成视频，大多数阶段为低分辨率，只有最后阶段为全分辨率。这种“金字塔流匹配”方法保持了视频的高视觉质量前提下，大幅降低了计算成本，tokens 数量是传统 diffusion 模型的四分之一。
快速推理：在推理过程中，该模型可以在 56 秒内生成一个 5 秒、384p 的视频，速度媲美许多全序列 diffusion 模型，甚至更快。
开源和商业使用：Pyramid-Flow 在 MIT 许可证下发布，允许广泛的使用，包括商业应用、修改和再分发，吸引了希望将模型集成到专有系统中的开发者和公司。

靠谱客附上参考地址

Pyramidal Flow Matching for Efficient Video Generative Modeling
New high quality AI video generator Pyramid Flow launches — and it’s fully open source!
Hugging Face
Github
Pyramidal Flow Matching for Efficient Video Generative Modeling

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，靠谱客所有文章均包含本声明。

点赞(148)

本文分类：人工智能

相关文章

Counterpoint：2024Q2 AI 服务器全球市场占比达 29%

Counterpoint：2024Q2 AI 服务器全球市场占比达 29%

OpenAI 推出 meta-prompt 工具，AI 时代让你掌握提示词艺术

OpenAI 推出 meta-prompt 工具，AI 时代让你掌握提示词艺术

上海大学发表论文，展示深度学习技术在材料微纳结构成像技术中的应用

上海大学发表论文，展示深度学习技术在材料微纳结构成像技术中的应用

上海交大联合开发 AI 系统，首次实现孕前精准预测流产风险

上海交大联合开发 AI 系统，首次实现孕前精准预测流产风险

快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

应对暗调照片的好方法，复古胶片风格影调模拟

应对暗调照片的好方法，复古胶片风格影调模拟

大光圈为什么受到这么多人的喜爱，它都适合哪些题材？

大光圈为什么受到这么多人的喜爱，它都适合哪些题材？

怎样选择摄影三脚架，这些参数要看好

怎样选择摄影三脚架，这些参数要看好

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部