Qwen AI 模型

面向复杂语言任务的尖端 Transformer 模型

高级推理、编码和多模态能力

由阿里巴巴创新AI研究驱动

由阿里云开发的 Qwen AI 提供了先进的基于 Transformer 的语言模型,针对复杂推理、有效的编码辅助和强大的自然语言理解进行优化。经过广泛的预训练、指令调优和多模态能力提升,Qwen 支持强大的多轮互动,并可广泛应用于研究、自动化、编码和企业级应用中。

  • ✓ 多样的模型尺寸 – Qwen2.5 提供了从0.5B到72B参数的多种模型,满足不同计算需求和应用场景。
  • ✓ 广泛的预训练 – 在超过18万亿token的数据集上训练,确保卓越的上下文理解和广泛的知识覆盖。
  • ✓ 先进的 Transformer 架构 – 针对高效推理、精准推理和多模态处理能力进行了优化。
  • ✓ 指令调优与强化学习 – 通过监督微调和多阶段强化学习,提供精准、结构化的响应。

关于 Qwen AI 模型

Qwen AI 是由阿里云创建的开源大型语言模型系列。其最新版本 Qwen2.5 在语言理解、编码能力和复杂推理方面取得了显著的增强。

Qwen2.5 模型采用全面的预训练和指令调优过程,在性能评测上达到与 OpenAI 和 DeepSeek 等领先AI系统相媲美的表现。

Qwen 系列推出了专门的变体模型,例如采用混合专家(MoE)架构的 Qwen2.5-Max,以提高效率,以及结合视觉和语言理解的多模态模型 Qwen2.5-VL。

模型提供多种参数规模,从适合本地部署的轻量模型到针对高需求推理任务优化的72B参数大型模型。

Qwen2.5 在关键评测基准上表现卓越,包括 HumanEval 编码测试、GSM8K 数学问题解决和 MMLU 综合语言理解。

以 Apache 2.0 许可证开源,Qwen 鼓励AI社区的全球协作与创新,可在 GitHub 和 Hugging Face 等平台上获取。