Qwen AI Models

Alibaba Cloud's model team. Builds the Qwen series covering text, vision, code, and audio.

Founded 2023Hangzhou, China38 Models Website →

Qwen3 235B A22B Instruct 2507

Qwen

Qwen3-235B-A22B-Instruct-2507 is a multilingual, instruction-tuned mixture-of-experts language model based on the Qwen3-235B architecture, with 22B active parameters per forward pass.

Context262K

Speed41 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3 Coder Next

Qwen

Qwen3-Coder-Next is an open-weight causal language model optimized for coding agents and local development workflows.

Context262K

Speed105 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3.5 397B A17B

Qwen

The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency.

Context262K

Speed78 tok/s

InputText, Image, Video

OutputText

ReasoningYes

Details →

Qwen3 Coder 480B A35B

Qwen

Qwen3-Coder-480B-A35B-Instruct is a Mixture-of-Experts (MoE) code generation model developed by the Qwen team.

Context262K

Speed57 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3 VL 235B A22B Instruct

Qwen

Qwen3-VL-235B-A22B Instruct is an open-weight multimodal model that unifies strong text generation with visual understanding across images and video.

Context262K

Speed45 tok/s

InputText, Image

OutputText

ReasoningNo

Details →

Qwen3 32B

Qwen

Qwen3-32B is a dense 32.8B parameter causal language model from the Qwen3 series, optimized for both complex reasoning and efficient dialogue.

Context41K

Speed89 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen3.5 Plus

Qwen

The Qwen3.5 native vision-language series Plus models are built on a hybrid architecture that integrates linear attention mechanisms with sparse mixture-of-experts models, achieving higher inference efficiency.

Context1.0M

SpeedN/A

InputText, Image, Video

OutputText

ReasoningYes

Details →

Qwen3 30B A3B Instruct 2507

Qwen

Qwen3-30B-A3B-Instruct-2507 is a 30.5B-parameter mixture-of-experts language model from Qwen, with 3.3B active parameters per inference.

Context262K

Speed72 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3 30B A3B

Qwen

Qwen3, the latest generation in the Qwen large language model series, features both dense and mixture-of-experts (MoE) architectures to excel in reasoning, multilingual support, and advanced agent tasks.

Context41K

Speed69 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen3 Next 80B A3B Instruct

Qwen

Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces.

Context262K

Speed133 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3 8B

Qwen

Qwen3-8B is a dense 8.2B parameter causal language model from the Qwen3 series, designed for both reasoning-heavy tasks and efficient dialogue.

Context32K

Speed53 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen3 Coder 30B A3B Instruct

Qwen

Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use.

Context160K

Speed21 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen-Plus

Qwen

Qwen-Plus, based on the Qwen2.5 foundation model, is a 131K context model with a balanced performance, speed, and cost combination.

Context1.0M

SpeedN/A

InputText

OutputText

ReasoningNo

Details →

Qwen3 VL 8B Instruct

Qwen

Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video.

Context131K

Speed117 tok/s

InputImage, Text

OutputText

ReasoningNo

Details →

Qwen2.5 7B Instruct

Qwen

Qwen2.5 7B is the latest series of Qwen large language models.

Context33K

SpeedN/A

InputText

OutputText

ReasoningNo

Details →

Qwen3 VL 30B A3B Instruct

Qwen

Qwen3-VL-30B-A3B-Instruct is a multimodal model that unifies strong text generation with visual understanding for images and videos.

Context131K

Speed102 tok/s

InputText, Image

OutputText

ReasoningNo

Details →

Qwen3 30B A3B Thinking 2507

Qwen

Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking.

Context33K

SpeedN/A

InputText

OutputText

ReasoningYes

Details →

Qwen-Turbo

Qwen

Qwen-Turbo, based on Qwen2.5, is a 1M context model that provides fast speed and low cost, suitable for simple tasks.

Context131K

Speed69 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3 235B A22B

Qwen

Qwen3-235B-A22B is a 235B parameter mixture-of-experts (MoE) model developed by Qwen, activating 22B parameters per forward pass.

Context131K

Speed36 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen3 Max Thinking

Qwen

Qwen3-Max-Thinking is the flagship reasoning model in the Qwen3 series, designed for high-stakes cognitive tasks that require deep, multi-step reasoning.

Context262K

Speed42 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen2.5 VL 72B Instruct

Qwen

Qwen2.5-VL is proficient in recognizing common objects such as flowers, birds, fish, and insects.

Context33K

SpeedN/A

InputText, Image

OutputText

ReasoningNo

Details →

Qwen2.5 72B Instruct

qwen

Qwen2.5 72B is the latest series of Qwen large language models.

Context33K

Speed45 tok/s

InputText

OutputText

ReasoningNo

Details →

Qwen3 14B

Qwen

Qwen3-14B is a dense 14.8B parameter causal language model from the Qwen3 series, designed for both complex reasoning and efficient dialogue.

Context41K

Speed86 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen2.5 VL 32B Instruct

Qwen

Qwen2.5-VL-32B is a multimodal vision-language model fine-tuned through reinforcement learning for enhanced mathematical reasoning, structured outputs, and visual problem-solving capabilities.

Context128K

SpeedN/A

InputText, Image

OutputText

ReasoningNo

Details →

Qwen2.5-VL 7B Instruct

Qwen

Qwen2.5 VL 7B is a multimodal LLM from the Qwen Team with the following key enhancements: - SoTA understanding of images of various resolution & ratio: Qwen2.5-VL achieves state-of-the-art performance on visual understanding benchmarks, including MathVista, DocVQA, RealWorldQA, MTVQA, etc. - Understanding videos of 20min+: Qwen2.5-VL can understand videos over 20 minutes for high-quality video-based question answering, dialog, content creation, etc. - Agent that can operate your mobiles, robots, etc.: with the abilities of complex reasoning and decision making, Qwen2.5-VL can be integrated with devices like mobile phones, robots, etc., for automatic operation based on visual environment and text instructions. - Multilingual Support: to serve global users, besides English and Chinese, Qwen2.5-VL now supports the understanding of texts in different languages inside images, including most European languages, Japanese, Korean, Arabic, Vietnamese, etc.

Context33K

SpeedN/A

InputText, Image

OutputText

ReasoningNo

Details →

Qwen3 Coder Plus

Qwen

Qwen3 Coder Plus is Alibaba's proprietary version of the Open Source Qwen3 Coder 480B A35B.

Context1.0M

SpeedN/A

InputText

OutputText

ReasoningYes

Details →

Qwen3 Max

Qwen

Qwen3-Max is an updated release built on the Qwen3 series, offering major improvements in reasoning, instruction following, multilingual support, and long-tail knowledge coverage compared to the January 2025 version.

Context262K

Speed54 tok/s

InputText

OutputText

ReasoningYes

Details →

QwQ 32B

Qwen

QwQ is the reasoning model of the Qwen series.

Context33K

Speed56 tok/s

InputText

OutputText

ReasoningYes

Details →

Qwen2.5 Coder 7B Instruct

Qwen

Qwen2.5-Coder-7B-Instruct is a 7B parameter instruction-tuned language model optimized for code-related tasks such as code generation, reasoning, and bug fixing.

Context33K

SpeedN/A

InputText

OutputText

ReasoningNo

Details →

Qwen3 VL 32B Instruct

Qwen

Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video.

Context131K

Speed66 tok/s

InputText, Image

OutputText

ReasoningNo

Details →

Qwen3 Coder Flash

Qwen

Qwen3 Coder Flash is Alibaba's fast and cost efficient version of their proprietary Qwen3 Coder Plus.

Context1.0M

SpeedN/A

InputText

OutputText

ReasoningNo

Details →

Qwen3 Next 80B A3B Thinking

Qwen

Qwen3-Next-80B-A3B-Thinking is a reasoning-first chat model in the Qwen3-Next line that outputs structured “thinking” traces by default.

Context128K

SpeedN/A

InputText

OutputText

ReasoningYes

Details →

Qwen VL Max

Qwen

Qwen VL Max is a visual understanding model with 7500 tokens context length.

Context131K

Speed27 tok/s

InputText, Image

OutputText

ReasoningNo

Details →

Qwen2.5 Coder 32B Instruct

qwen

Qwen2.5-Coder is the latest series of Code-Specific Qwen large language models (formerly known as CodeQwen).

Context33K

SpeedN/A

InputText

OutputText

ReasoningNo

Details →

Qwen Plus 0728

Qwen

Qwen Plus 0728, based on the Qwen3 foundation model, is a 1 million context hybrid reasoning model with a balanced performance, speed, and cost combination.

Context1.0M

SpeedN/A

InputText

OutputText

ReasoningYes

Details →

Qwen3 VL 8B Thinking

Qwen

Qwen3-VL-8B-Thinking is the reasoning-optimized variant of the Qwen3-VL-8B multimodal model, designed for advanced visual and textual reasoning across complex scenes, documents, and temporal sequences.

Context131K

SpeedN/A

InputImage, Text

OutputText

ReasoningYes

Details →

Qwen VL Plus

Qwen

Qwen's Enhanced Large Visual Language Model.

Context131K

SpeedN/A

InputText, Image

OutputText

ReasoningNo

Details →

Qwen-Max

Qwen

Qwen-Max, based on Qwen2.5, provides the best inference performance among [Qwen models](/qwen), especially for complex multi-step tasks.

Context33K

SpeedN/A

InputText

OutputText

ReasoningNo

Details →