这份资料介绍了Qwen2.5-Coder系列模型,这是CodeQwen1.5的重大升级版。该系列包含六种不同大小的模型(0.5B到32B),专门为代码相关任务设计,但同时保留了通用和数学能力。这些模型通过精细的数据清洗、可扩展的合成数据生成以及平衡的数据混合进行预训练,数据量超过5.5万亿个token。评估结果显示,Qwen2.5-Coder在代码生成、补全、推理和修复等十多个基准测试中取得了最先进的性能,甚至超越了同等规模的更大模型。该模型的发布旨在推动代码智能领域的研究,并支持开发者在实际应用中广泛采用。arxiv.org
Информация
- Подкаст
- ЧастотаЕжедневно
- Опубликовано14 июля 2025 г. в 01:00 UTC
- Длительность9 мин.
- ОграниченияБез ненормативной лексики