14 ИЮЛ.
9 МИН.

Qwen2.5-Coder系列模型

这份资料介绍了Qwen2.5-Coder系列模型，这是CodeQwen1.5的重大升级版。该系列包含六种不同大小的模型（0.5B到32B），专门为代码相关任务设计，但同时保留了通用和数学能力。这些模型通过精细的数据清洗、可扩展的合成数据生成以及平衡的数据混合进行预训练，数据量超过5.5万亿个token。评估结果显示，Qwen2.5-Coder在代码生成、补全、推理和修复等十多个基准测试中取得了最先进的性能，甚至超越了同等规模的更大模型。该模型的发布旨在推动代码智能领域的研究，并支持开发者在实际应用中广泛采用。arxiv.org

Веб-страница выпуска

Подкаст

大模型论文天天读
Частота

Ежедневно
Опубликовано

14 июля 2025 г. в 01:00 UTC
Длительность

9 мин.
Ограничения

Без ненормативной лексики

Qwen2.5-Coder系列模型

Информация