복잡한 언어 작업을 위한 최첨단 트랜스포머 모델
알리바바 클라우드에서 개발한 Qwen AI는 고급 추론, 효과적인 코딩 지원 및 강력한 자연어 이해를 최적화한 트랜스포머 기반 언어 모델을 제공합니다. 방대한 사전 훈련, 지침 튜닝 및 다중 모달 기능을 통해 Qwen은 연구, 자동화, 코딩 및 기업 응용 분야에서 강력한 다중 턴 상호작용과 다용도의 사용 사례를 제공합니다.
Qwen AI는 알리바바 클라우드에서 개발한 오픈 소스 대형 언어 모델 시리즈입니다. 최신 버전인 Qwen2.5는 언어 이해, 코딩 기능 및 복잡한 추론에서 중요한 향상을 이루었습니다.
Qwen2.5 모델은 포괄적인 사전 훈련 및 지침 튜닝 과정을 통해 OpenAI 및 DeepSeek와 같은 주요 AI 시스템과 비교할 수 있는 성능을 달성했습니다.
Qwen 시리즈는 Qwen2.5-Max와 같은 전문가 혼합(MoE) 아키텍처를 사용하여 효율성을 높이고, Qwen2.5-VL은 시각과 언어 이해를 결합하여 다중 모달 응용 프로그램을 지원합니다.
모델은 다양한 파라미터 크기로 제공되며, 로컬 배포에 적합한 경량 모델부터 고급 추론 작업을 최적화한 72B 파라미터 모델까지 지원합니다.
Qwen2.5는 HumanEval(코딩), GSM8K(수학 문제 해결), MMLU(포괄적인 언어 이해 작업)와 같은 주요 벤치마크에서 뛰어난 성능을 보입니다.
Apache 2.0 라이센스 하에 오픈 소스로 제공되며, Qwen은 AI 커뮤니티 내에서 글로벌 협업과 혁신을 촉진하고 GitHub 및 Hugging Face와 같은 플랫폼을 통해 접근할 수 있습니다.