中国电信 AI 研究院完成首个全国产化万卡万参大模型训练，TeleChat2-115B 对外开源

2024-10-11 07:03 269 阅读 0 评论 178 点赞

靠谱客 9 月 28 日消息，“中国电信人工智能研究院”官方公众号今天宣布，中国电信人工智能研究院（靠谱客注：下文称 TeleAI）成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型，并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。

中国电信 ai 研究院完成首个全国产化万卡万参大模型训练，telechat2-115b 对外开源

官方表示，这项科研成果标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。

TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成。据介绍，其在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性，实现了 GPU 同等算力计算效率超 93% ，模型有效训练时长占比超 98% 。

针对超大参数模型训练，TeleAI 采用了大量小模型进行 Scaling，进而验证不同模型结构的有效性。同时，在数据配比方面，基于小模型实验结果反馈，采用回归预测模型，得到较优数据配比。

在 Post-Training（后训练）方面，TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据，用于 SFT（监督式微调）第一阶段模型训练。

其次，其采用迭代式更新策略，使用模型对提示词数据进行指令复杂性提升与多样性扩充，通过模型合成和人工标注提升答案质量，并利用拒绝采样获取优质 SFT 数据及 RM（奖励模型）代表性数据，用于 SFT 训练和 DPO（偏好对齐）训练，以及模型效果迭代。

靠谱客附开源地址

GitHub：

https://github.com/Tele-AI/TeleChat2

Gitee：

https://gitee.com/Tele-AI/tele-chat2

ModelScope：

https://modelscope.cn/models/TeleAI/TeleChat2-115B

Modelers：

https://modelers.cn/models/TeleAI/TeleChat2-115B

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，靠谱客所有文章均包含本声明。

点赞(178)

本文分类：人工智能

相关文章

科学家成功研发可弯曲的非硅柔性芯片，成本不到 1 美元

科学家成功研发可弯曲的非硅柔性芯片，成本不到 1 美元

三星预言 2025 年将掀起 AI 普及浪潮，重塑消费者日常生活方式

三星预言 2025 年将掀起 AI 普及浪潮，重塑消费者日常生活方式

三星重申 Galaxy AI 部分功能明年底可能收费，高管曾称会物有所值

三星重申 Galaxy AI 部分功能明年底可能收费，高管曾称会物有所值

苏黎世联邦理工学院研究：AI 可 100% 绕过谷歌 reCAPTCHA V2 验证

苏黎世联邦理工学院研究：AI 可 100% 绕过谷歌 reCAPTCHA V2 验证

中国电信 AI 研究院完成首个全国产化万卡万参大模型训练，TeleChat2-115B 对外开源

中国电信 AI 研究院完成首个全国产化万卡万参大模型训练，TeleChat2-115B 对外开源

三星：降频 100MHz 是 Exynos 2400 / e 唯一差异，几乎不影响实际体验

三星：降频 100MHz 是 Exynos 2400 / e 唯一差异，几乎不影响实际体验

英伟达 CEO 黄仁勋：核电是满足数据中心爆炸式增长能源需求优秀选择

英伟达 CEO 黄仁勋：核电是满足数据中心爆炸式增长能源需求优秀选择

三星 Galaxy S25 Ultra 手机被曝升级 16GB 内存，助推 Galaxy AI 革命性体验

三星 Galaxy S25 Ultra 手机被曝升级 16GB 内存，助推 Galaxy AI 革命性体验

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部