面向复杂语言任务的尖端 Transformer 模型
由阿里云开发的 Qwen AI 提供了先进的基于 Transformer 的语言模型,针对复杂推理、有效的编码辅助和强大的自然语言理解进行优化。经过广泛的预训练、指令调优和多模态能力提升,Qwen 支持强大的多轮互动,并可广泛应用于研究、自动化、编码和企业级应用中。
Qwen AI 是由阿里云创建的开源大型语言模型系列。其最新版本 Qwen2.5 在语言理解、编码能力和复杂推理方面取得了显著的增强。
Qwen2.5 模型采用全面的预训练和指令调优过程,在性能评测上达到与 OpenAI 和 DeepSeek 等领先AI系统相媲美的表现。
Qwen 系列推出了专门的变体模型,例如采用混合专家(MoE)架构的 Qwen2.5-Max,以提高效率,以及结合视觉和语言理解的多模态模型 Qwen2.5-VL。
模型提供多种参数规模,从适合本地部署的轻量模型到针对高需求推理任务优化的72B参数大型模型。
Qwen2.5 在关键评测基准上表现卓越,包括 HumanEval 编码测试、GSM8K 数学问题解决和 MMLU 综合语言理解。
以 Apache 2.0 许可证开源,Qwen 鼓励AI社区的全球协作与创新,可在 GitHub 和 Hugging Face 等平台上获取。