腾讯混元文生图大模型宣布开源：首个中文原生DiT架构

2024-05-30 08:20 113 阅读 0 评论 75 点赞

靠谱客(kaopuke.com) 5月30日消息:今日，腾讯旗下引人注目的混元文生图大模型（混元DiT）宣布全面开源，这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布，包含完整的模型权重、推理代码和算法，面向全球的企业与个人开发者免费开放商用。

腾讯混元文生图大模型的负责人卢清林表示，混元DiT的开源具有双重价值。首先，作为业内首个中文原生DiT架构，它填补了开源社区的空白，为中文领域的多模态视觉生成提供了强有力的支持。其次，混元DiT的开源是全面开放的，与现网版本完全一致，保证了开发者和用户能够获取到最先进、最实用的技术。

首个中文原生dit架构！腾讯混元文生图大模型宣布全面开源

此次开源的混元DiT采用了与Sora同样的关键技术DiT架构，不仅支持256字中文理解，还能够作为视频等多模态视觉生成的基础。为了实现这一功能，腾讯团队精心设计了Transformer结构、文本编码器和位置编码，并构建了完整的数据管道，用于持续更新和评估数据，为模型的优化迭代提供了有力支持。

值得一提的是，混元DiT还通过训练多模态大语言模型来优化图像的文本描述，实现了细粒度的文本理解。这使得用户能够与之进行多轮对话，根据上下文生成并完善图像，为创意设计和内容创作提供了无限可能。

腾讯混元文生图大模型的全面开源，无疑将为全球的开发者和用户带来更为广阔的创新空间和应用前景。我们期待这一技术的进一步发展和应用，为人工智能领域带来更多的惊喜和突破。

项目地址：https://github.com/Tencent/HunyuanDiT

（举报）

点赞(75)

本文分类：腾讯
本文链接：https://www.kaopuke.com/news/k-p-k_14_uzo_2_fw_13__23__6__27_.html

相关文章

锤子便签iOS版更新v4.0：新增AI写作功能一年88.8元

锤子便签iOS版更新v4.0：新增AI写作功能一年88.8元

字节跳动正式发布自研豆包大模型系列覆盖九大模型

字节跳动正式发布自研豆包大模型系列覆盖九大模型

阿里京东今年618均取消预售天猫618售卖时间表一览

阿里京东今年618均取消预售天猫618售卖时间表一览

腾讯开源混元DiT 图像生成模型可根据对话上下文生成并细化图像

腾讯开源混元DiT 图像生成模型可根据对话上下文生成并细化图像

腾讯混元文生图大模型宣布开源：首个中文原生DiT架构

腾讯混元文生图大模型宣布开源：首个中文原生DiT架构

淘宝重启网页版称将深入探索AI电商场景

淘宝重启网页版称将深入探索AI电商场景

淘宝App首页改版频道入口变双栏呈现

淘宝App首页改版频道入口变双栏呈现

4款新品1499元起影像新蓝图暨vivo X系列新品发布会汇总

4款新品1499元起影像新蓝图暨vivo X系列新品发布会汇总

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部