Qwen AI 模型

面向复杂语言任务的尖端 Transformer 模型

高级推理、编码和多模态能力

由阿里巴巴创新AI研究驱动

由阿里云开发的 Qwen AI 提供了先进的基于 Transformer 的语言模型，针对复杂推理、有效的编码辅助和强大的自然语言理解进行优化。经过广泛的预训练、指令调优和多模态能力提升，Qwen 支持强大的多轮互动，并可广泛应用于研究、自动化、编码和企业级应用中。

探索 Qwen AI

Qwen AI 是由阿里云创建的开源大型语言模型系列。其最新版本 Qwen2.5 在语言理解、编码能力和复杂推理方面取得了显著的增强。

Qwen2.5 模型采用全面的预训练和指令调优过程，在性能评测上达到与 OpenAI 和 DeepSeek 等领先AI系统相媲美的表现。

Qwen 系列推出了专门的变体模型，例如采用混合专家（MoE）架构的 Qwen2.5-Max，以提高效率，以及结合视觉和语言理解的多模态模型 Qwen2.5-VL。

模型提供多种参数规模，从适合本地部署的轻量模型到针对高需求推理任务优化的72B参数大型模型。

Qwen2.5 在关键评测基准上表现卓越，包括 HumanEval 编码测试、GSM8K 数学问题解决和 MMLU 综合语言理解。

以 Apache 2.0 许可证开源，Qwen 鼓励AI社区的全球协作与创新，可在 GitHub 和 Hugging Face 等平台上获取。