Unsloth发布Dynamic v2.0量化方法，并开源DeepSeek-R1/-V3-0324 的新量化版本!

2025-04-27 12:32 369 阅读 0 评论 244 点赞

Unsloth 最近发布了 Dynamic v2.0 量化版本，该版本在 MMLU 和 KL Divergence 的成绩上均优于之前的量化版本。

在5-shot MMLU和KL散度测试中创下新纪录！这意味着你现在可以运行和微调量化后的LLM，同时保持最大程度的准确性。

需要注意的是，这些结论是基于 5-shot 的实验结果，并且每个实验运行 5 次以获取最优值，因此量化版本的稳定性仍需考虑。

此外，Unsloth 未来将继续使用 Dynamic v2.0 进行新版本的量化更新。同时，Unsloth 也修复了 llama.cpp 中与 llama-4 相关的 RoPE 实现问题，并推出了 DeepSeek-R1 和 DeepSeek-V3-0324 的新量化版本。

DeepSeek-V3-0324 在几个关键方面比其前身 DeepSeek-V3 有了显著的改进。

增强表现：

前端 Web 开发：提高了代码的可执行性以及更美观的网页和游戏前端。

中文写作能力：

与 R1 写作风格保持一致，更好的中长格式写作质量。
改进的多轮交互式重写，优化翻译质量和信件写作。
中文搜索功能：增强的报告分析请求，具有更详细的输出
函数调用改进：提高了函数调用的准确性，修复了以前 V3 版本中的问题
Dynamic v2.0的核心创新点：
（1）全新层选择算法：不再仅修改部分层，而是动态调整每一层的量化类型。
（2）模型专属量化方案：为每个模型定制专属量化方案，例如Gemma 3和Llama 4的量化层差异明显。
（3）高质量校准数据集：使用30万到150万token的高质量、手工策划的数据集，大大提升对话性能。
开源地址：https://huggingface.co/unsloth/DeepSeek-R1-GGUF-UD
https://huggingface.co/unsloth/DeepSeek-V3-0324-GGUF-UD

点赞(244)

本文分类：科技
本文链接：https://www.kaopuke.com/news/k-p-k_13_uzocf0_14__23__10__27_.html

相关文章

索尼Xperia 1 VII真机首曝：手机行业唯一清流设计

索尼Xperia 1 VII真机首曝：手机行业唯一清流设计

卤鹅哥回应49岁单身原因：比较注重事业发展有责任心

卤鹅哥回应49岁单身原因：比较注重事业发展有责任心

小米申请注册“小米御七”商标：YU7将于6-7月上市

小米申请注册“小米御七”商标：YU7将于6-7月上市

Create2025百度AI开发者大会上热搜 4.5Turbo、X1Turbo发布

Create2025百度AI开发者大会上热搜 4.5Turbo、X1Turbo发布

Unsloth发布Dynamic v2.0量化方法，并开源DeepSeek-R1/-V3-0324 的新量化版本!

Unsloth发布Dynamic v2.0量化方法，并开源DeepSeek-R1/-V3-0324 的新量化版本!

阿里开源Open Avatar Chat：实时数字人对话项目！支持文本、音视频等多种交互方式！

3天狂澜3.9Kstar！逆天AI开源智能体助手Suna：免费替你搞定一切，效率飙升！

3天狂澜3.9Kstar！逆天AI开源智能体助手Suna：免费替你搞定一切，效率飙升！

科研党专属的“提效神器”！OpenBMB智能开源助手「卷姬」上线：报告生成兼具深度与高度！

科研党专属的“提效神器”！OpenBMB智能开源助手「卷姬」上线：报告生成兼具深度与高度！

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部