KI-Modell-Ranking (LLM-Leaderboard)

Schnellste KI-Modelle

Sprachmodelle nach Inference-Geschwindigkeit und Durchsatz

Modell
Name des KI-Modells und Anbieterorganisation
Preis/1 Mio.
Kosten pro 1 Million Tokens — Input (Text, den Sie senden) / Output (Text, den das Modell erzeugt)
MMLU-Pro
Massive Multitask Language Understanding (Professional) - testet breites Wissen in 14 Fachbereichen, inklusive MINT, Geistes- und Sozialwissenschaften
Geschwindigkeit
Inference-Durchsatz in Tokens pro Sekunde - wie schnell das Modell Antworten generiert
GPQA
Graduate-level Google-Proof Q&A Benchmark - testet Denken auf Promotionsniveau und fortgeschrittene Intelligenz
AIME 2025
American Invitational Mathematics Examination 2025 - testet fortgeschrittene mathematische Problemlösungsfähigkeit
Veröffentlichung
Zeitpunkt der Veröffentlichung - neuere Modelle können mehr Fähigkeiten bieten
Vergleichen
Inception KI-Anbieter-Logo - Mercury 2
#1 Mercury 2
von Inception
$0.25 / $0.75 - 901 tok/s 77.0% - 20. Feb. 2026
IBM KI-Anbieter-Logo - Granite 4.0 H Small
#2 Granite 4.0 H Small
von IBM
$0.06 / $0.25 62.4% 459 tok/s 41.6% 13.7% 22. Sept. 2025
IBM KI-Anbieter-Logo - Granite 3.3 8B (Non-reasoning)
#3 Granite 3.3 8B (Non-reasoning)
von IBM
$0.03 / $0.25 46.8% 364 tok/s 33.8% 6.7% 16. Apr. 2025
Google KI-Anbieter-Logo - Gemini 3.1 Flash-Lite Preview
#4 Gemini 3.1 Flash-Lite Preview
von Google
$0.25 / $1.50 - 353 tok/s 82.2% - 3. März 2026
Amazon KI-Anbieter-Logo - Nova Micro
#5 Nova Micro
von Amazon
$0.04 / $0.14 53.1% 333 tok/s 35.8% 6.0% 3. Dez. 2024
Google KI-Anbieter-Logo - Gemini 2.5 Flash-Lite (Reasoning)
#6 Gemini 2.5 Flash-Lite (Reasoning)
von Google
$0.10 / $0.40 75.9% 301 tok/s 62.5% 53.3% 17. Juni 2025
OpenAI KI-Anbieter-Logo - gpt-oss-20B (high)
#7 gpt-oss-20B (high)
von OpenAI
$0.07 / $0.20 74.8% 294 tok/s 68.8% 89.3% 5. Aug. 2025
Mistral KI-Anbieter-Logo - Ministral 3 3B
#8 Ministral 3 3B
von Mistral
$0.10 / $0.10 52.4% 288 tok/s 35.8% 22.0% 2. Dez. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 0.8B (Non-reasoning)
#9 Qwen3.5 0.8B (Non-reasoning)
von Alibaba
$0.01 / $0.05 - 283 tok/s 23.6% - 2. März 2026
Google KI-Anbieter-Logo - Gemini 2.5 Flash-Lite (Non-reasoning)
#10 Gemini 2.5 Flash-Lite (Non-reasoning)
von Google
$0.10 / $0.40 72.4% 279 tok/s 47.4% 35.3% 17. Juni 2025
Sarvam KI-Anbieter-Logo - Sarvam 30B (high)
#11 Sarvam 30B (high)
von Sarvam
k. A. / k. A. - 261 tok/s 63.3% - 6. März 2026
OpenAI KI-Anbieter-Logo - gpt-oss-20B (low)
#12 gpt-oss-20B (low)
von OpenAI
$0.07 / $0.20 71.8% 259 tok/s 61.1% 62.3% 5. Aug. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 2B (Non-reasoning)
#13 Qwen3.5 2B (Non-reasoning)
von Alibaba
$0.02 / $0.10 - 241 tok/s 43.8% - 2. März 2026
Alibaba KI-Anbieter-Logo - Qwen3.6 35B A3B (Reasoning)
#14 Qwen3.6 35B A3B (Reasoning)
von Alibaba
$0.38 / $2.25 - 238 tok/s 84.1% - 16. Apr. 2026
Google KI-Anbieter-Logo - Gemini 2.5 Flash (Reasoning)
#15 Gemini 2.5 Flash (Reasoning)
von Google
$0.30 / $2.50 83.2% 235 tok/s 79.0% 73.3% 20. Mai 2025
Amazon KI-Anbieter-Logo - Nova 2.0 Omni (Non-reasoning)
#16 Nova 2.0 Omni (Non-reasoning)
von Amazon
$0.30 / $2.50 71.9% 230 tok/s 55.5% 37.0% 26. Nov. 2025
Amazon KI-Anbieter-Logo - Nova Lite
#17 Nova Lite
von Amazon
$0.06 / $0.24 59.0% 227 tok/s 43.3% 7.0% 3. Dez. 2024
xAI KI-Anbieter-Logo - Grok 4.20 0309 v2 (Reasoning)
#18 Grok 4.20 0309 v2 (Reasoning)
von xAI
$2.00 / $6.00 - 219 tok/s 91.1% - 7. Apr. 2026
xAI KI-Anbieter-Logo - Grok 3 mini Reasoning (high)
#19 Grok 3 mini Reasoning (high)
von xAI
$0.30 / $0.50 82.8% 216 tok/s 79.1% 84.7% 19. Feb. 2025
Mistral KI-Anbieter-Logo - Devstral Small (Jul '25)
#20 Devstral Small (Jul '25)
von Mistral
$0.10 / $0.30 62.2% 212 tok/s 41.4% 29.3% 10. Juli 2025
OpenAI KI-Anbieter-Logo - gpt-oss-120B (high)
#21 gpt-oss-120B (high)
von OpenAI
$0.15 / $0.60 80.8% 212 tok/s 78.2% 93.4% 5. Aug. 2025
OpenAI KI-Anbieter-Logo - GPT-5.1 Codex mini (high)
#22 GPT-5.1 Codex mini (high)
von OpenAI
$0.25 / $2.00 82.0% 210 tok/s 81.3% 91.7% 13. Nov. 2025
Google KI-Anbieter-Logo - Gemini 3 Flash Preview (Non-reasoning)
#23 Gemini 3 Flash Preview (Non-reasoning)
von Google
$0.50 / $3.00 88.2% 209 tok/s 81.2% 55.7% 17. Dez. 2025
xAI KI-Anbieter-Logo - Grok 4.20 0309 (Reasoning)
#24 Grok 4.20 0309 (Reasoning)
von xAI
$2.00 / $6.00 - 209 tok/s 88.5% - 10. März 2026
OpenAI KI-Anbieter-Logo - gpt-oss-120B (low)
#25 gpt-oss-120B (low)
von OpenAI
$0.15 / $0.60 77.5% 208 tok/s 67.2% 66.7% 5. Aug. 2025
xAI KI-Anbieter-Logo - Grok 4 Fast (Reasoning)
#26 Grok 4 Fast (Reasoning)
von xAI
$0.20 / $0.50 85.0% 208 tok/s 84.7% 89.7% 19. Sept. 2025
OpenAI KI-Anbieter-Logo - GPT-5 Codex (high)
#27 GPT-5 Codex (high)
von OpenAI
$1.25 / $10.00 86.5% 208 tok/s 83.7% 98.7% 23. Sept. 2025
xAI KI-Anbieter-Logo - Grok 4 Fast (Non-reasoning)
#28 Grok 4 Fast (Non-reasoning)
von xAI
$0.20 / $0.50 73.0% 206 tok/s 60.6% 41.3% 19. Sept. 2025
Amazon KI-Anbieter-Logo - Nova 2.0 Lite (low)
#29 Nova 2.0 Lite (low)
von Amazon
$0.30 / $2.50 78.8% 199 tok/s 69.8% 46.7% 29. Okt. 2025
Google KI-Anbieter-Logo - Gemini 3 Flash Preview (Reasoning)
#30 Gemini 3 Flash Preview (Reasoning)
von Google
$0.50 / $3.00 89.0% 198 tok/s 89.8% 97.0% 17. Dez. 2025
OpenAI KI-Anbieter-Logo - GPT-5.1 Codex (high)
#31 GPT-5.1 Codex (high)
von OpenAI
$1.25 / $10.00 86.0% 198 tok/s 86.0% 95.7% 13. Nov. 2025
Amazon KI-Anbieter-Logo - Nova 2.0 Lite (medium)
#32 Nova 2.0 Lite (medium)
von Amazon
$0.30 / $2.50 81.3% 197 tok/s 76.8% 88.7% 29. Okt. 2025
Mistral KI-Anbieter-Logo - Ministral 3 8B
#33 Ministral 3 8B
von Mistral
$0.15 / $0.15 64.2% 195 tok/s 47.1% 31.7% 2. Dez. 2025
xAI KI-Anbieter-Logo - Grok Code Fast 1
#34 Grok Code Fast 1
von xAI
$0.20 / $1.50 79.3% 194 tok/s 72.7% 43.3% 28. Aug. 2025
Mistral KI-Anbieter-Logo - Mistral 7B Instruct
#35 Mistral 7B Instruct
von Mistral
$0.25 / $0.25 24.5% 191 tok/s 17.7% - 27. Sept. 2023
OpenAI KI-Anbieter-Logo - GPT-5.4 mini (xhigh)
#36 GPT-5.4 mini (xhigh)
von OpenAI
$0.75 / $4.50 - 189 tok/s 87.5% - 17. März 2026
StepFun KI-Anbieter-Logo - Step 3.5 Flash 2603
#37 Step 3.5 Flash 2603
von StepFun
k. A. / k. A. - 188 tok/s 82.6% - 2. Apr. 2026
Google KI-Anbieter-Logo - Gemini 2.5 Flash (Non-reasoning)
#38 Gemini 2.5 Flash (Non-reasoning)
von Google
$0.30 / $2.50 80.9% 188 tok/s 68.3% 60.3% 20. Mai 2025
Alibaba KI-Anbieter-Logo - Qwen3 0.6B (Non-reasoning)
#39 Qwen3 0.6B (Non-reasoning)
von Alibaba
$0.11 / $0.42 23.1% 187 tok/s 23.1% 10.3% 28. Apr. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 4B (Non-reasoning)
#40 Qwen3.5 4B (Non-reasoning)
von Alibaba
$0.03 / $0.15 - 187 tok/s 71.2% - 2. März 2026
OpenAI KI-Anbieter-Logo - GPT-4.1 nano
#41 GPT-4.1 nano
von OpenAI
$0.10 / $0.40 65.7% 185 tok/s 51.2% 24.0% 14. Apr. 2025
Alibaba KI-Anbieter-Logo - Qwen3 0.6B (Reasoning)
#42 Qwen3 0.6B (Reasoning)
von Alibaba
$0.11 / $1.26 34.7% 185 tok/s 23.9% 18.0% 28. Apr. 2025
Amazon KI-Anbieter-Logo - Nova 2.0 Lite (high)
#43 Nova 2.0 Lite (high)
von Amazon
$0.30 / $2.50 81.8% 184 tok/s 81.1% 94.3% 29. Okt. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 4B (Reasoning)
#44 Qwen3.5 4B (Reasoning)
von Alibaba
$0.03 / $0.15 - 184 tok/s 77.1% - 2. März 2026
AI21 Labs KI-Anbieter-Logo - Jamba 1.6 Mini
#45 Jamba 1.6 Mini
von AI21 Labs
$0.20 / $0.40 36.7% 184 tok/s 30.0% - 6. März 2025
OpenAI KI-Anbieter-Logo - GPT-5.4 mini (medium)
#46 GPT-5.4 mini (medium)
von OpenAI
$0.75 / $4.50 - 180 tok/s 82.3% - 17. März 2026
Amazon KI-Anbieter-Logo - Nova 2.0 Pro Preview (Non-reasoning)
#47 Nova 2.0 Pro Preview (Non-reasoning)
von Amazon
$1.25 / $10.00 77.2% 180 tok/s 63.6% 30.7% 27. Nov. 2025
xAI KI-Anbieter-Logo - Grok 4.20 0309 (Non-reasoning)
#48 Grok 4.20 0309 (Non-reasoning)
von xAI
$2.00 / $6.00 - 177 tok/s 78.5% - 10. März 2026
Mistral KI-Anbieter-Logo - Magistral Small 1.2
#49 Magistral Small 1.2
von Mistral
$0.50 / $1.50 76.8% 176 tok/s 66.3% 80.3% 17. Sept. 2025
Mistral KI-Anbieter-Logo - Mistral Small 4 (Reasoning)
#50 Mistral Small 4 (Reasoning)
von Mistral
$0.15 / $0.60 - 175 tok/s 76.9% - 16. März 2026
Amazon KI-Anbieter-Logo - Nova 2.0 Lite (Non-reasoning)
#51 Nova 2.0 Lite (Non-reasoning)
von Amazon
$0.30 / $2.50 74.3% 173 tok/s 60.3% 33.7% 29. Okt. 2025
Alibaba KI-Anbieter-Logo - Qwen3 Next 80B A3B Instruct
#52 Qwen3 Next 80B A3B Instruct
von Alibaba
$0.50 / $2.00 81.9% 172 tok/s 73.8% 66.3% 11. Sept. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 Omni Flash
#53 Qwen3.5 Omni Flash
von Alibaba
$0.10 / $0.80 - 171 tok/s 74.2% - 30. März 2026
NVIDIA KI-Anbieter-Logo - NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)
#54 NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)
von NVIDIA
$0.20 / $0.60 64.9% 170 tok/s 43.9% 26.7% 28. Okt. 2025
StepFun KI-Anbieter-Logo - Step 3.5 Flash
#55 Step 3.5 Flash
von StepFun
$0.10 / $0.30 - 169 tok/s 83.1% - 2. Feb. 2026
Alibaba KI-Anbieter-Logo - Qwen3 Next 80B A3B (Reasoning)
#56 Qwen3 Next 80B A3B (Reasoning)
von Alibaba
$0.50 / $6.00 82.4% 167 tok/s 75.9% 84.3% 11. Sept. 2025
OpenAI KI-Anbieter-Logo - GPT-4o (Nov '24)
#57 GPT-4o (Nov '24)
von OpenAI
$2.50 / $10.00 74.8% 164 tok/s 54.3% 6.0% 20. Nov. 2024
OpenAI KI-Anbieter-Logo - GPT-5.4 nano (xhigh)
#58 GPT-5.4 nano (xhigh)
von OpenAI
$0.20 / $1.25 - 163 tok/s 81.7% - 17. März 2026
xAI KI-Anbieter-Logo - Grok 4.20 0309 v2 (Non-reasoning)
#59 Grok 4.20 0309 v2 (Non-reasoning)
von xAI
$2.00 / $6.00 - 162 tok/s 77.6% - 7. Apr. 2026
NVIDIA KI-Anbieter-Logo - NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)
#60 NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)
von NVIDIA
$0.06 / $0.24 79.4% 162 tok/s 75.7% 91.0% 15. Dez. 2025
OpenAI KI-Anbieter-Logo - GPT-5.4 mini (Non-Reasoning)
#61 GPT-5.4 mini (Non-Reasoning)
von OpenAI
$0.75 / $4.50 - 160 tok/s 60.6% - 17. März 2026
Alibaba KI-Anbieter-Logo - Qwen3.5 122B A10B (Reasoning)
#62 Qwen3.5 122B A10B (Reasoning)
von Alibaba
$0.40 / $3.20 - 160 tok/s 85.7% - 24. Feb. 2026
NVIDIA KI-Anbieter-Logo - NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
#63 NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
von NVIDIA
$0.30 / $0.75 - 159 tok/s 80.0% - 11. März 2026
OpenAI KI-Anbieter-Logo - GPT-5.4 nano (medium)
#64 GPT-5.4 nano (medium)
von OpenAI
$0.20 / $1.25 - 159 tok/s 76.1% - 17. März 2026
Meta KI-Anbieter-Logo - Llama 3.1 Instruct 8B
#65 Llama 3.1 Instruct 8B
von Meta
$0.10 / $0.10 47.6% 159 tok/s 25.9% 4.3% 23. Juli 2024
OpenAI KI-Anbieter-Logo - GPT-5 (ChatGPT)
#66 GPT-5 (ChatGPT)
von OpenAI
$1.25 / $10.00 82.0% 158 tok/s 68.6% 48.3% 7. Aug. 2025
xAI KI-Anbieter-Logo - Grok 4.1 Fast (Reasoning)
#67 Grok 4.1 Fast (Reasoning)
von xAI
$0.20 / $0.50 85.4% 157 tok/s 85.3% 89.3% 19. Nov. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 122B A10B (Non-reasoning)
#68 Qwen3.5 122B A10B (Non-reasoning)
von Alibaba
$0.40 / $3.20 - 155 tok/s 82.7% - 24. Feb. 2026
Mistral KI-Anbieter-Logo - Mistral Small (Sep '24)
#69 Mistral Small (Sep '24)
von Mistral
$0.20 / $0.60 52.9% 155 tok/s 38.1% - 17. Sept. 2024
OpenAI KI-Anbieter-Logo - GPT-5.4 nano (Non-Reasoning)
#70 GPT-5.4 nano (Non-Reasoning)
von OpenAI
$0.20 / $1.25 - 154 tok/s 55.8% - 17. März 2026
OpenAI KI-Anbieter-Logo - o3-mini
#71 o3-mini
von OpenAI
$1.10 / $4.40 79.1% 153 tok/s 74.8% - 31. Jan. 2025
Amazon KI-Anbieter-Logo - Nova 2.0 Pro Preview (low)
#72 Nova 2.0 Pro Preview (low)
von Amazon
$1.25 / $10.00 82.2% 153 tok/s 75.1% 63.3% 27. Nov. 2025
Mistral KI-Anbieter-Logo - Mistral Small 3.2
#73 Mistral Small 3.2
von Mistral
$0.10 / $0.30 68.1% 152 tok/s 50.5% 27.0% 20. Juni 2025
xAI KI-Anbieter-Logo - Grok 4.1 Fast (Non-reasoning)
#74 Grok 4.1 Fast (Non-reasoning)
von xAI
$0.20 / $0.50 74.3% 152 tok/s 63.7% 34.3% 19. Nov. 2025
Alibaba KI-Anbieter-Logo - Qwen3 30B A3B 2507 (Reasoning)
#75 Qwen3 30B A3B 2507 (Reasoning)
von Alibaba
$0.20 / $2.40 80.5% 152 tok/s 70.7% 56.3% 30. Juli 2025
Mistral KI-Anbieter-Logo - Mistral Small 3
#76 Mistral Small 3
von Mistral
$0.10 / $0.30 65.2% 152 tok/s 46.2% 4.3% 30. Jan. 2025
NVIDIA KI-Anbieter-Logo - NVIDIA Nemotron Nano 12B v2 VL (Reasoning)
#77 NVIDIA Nemotron Nano 12B v2 VL (Reasoning)
von NVIDIA
$0.20 / $0.60 75.9% 151 tok/s 57.2% 75.0% 28. Okt. 2025
Alibaba KI-Anbieter-Logo - Qwen3 Coder Next
#78 Qwen3 Coder Next
von Alibaba
$0.35 / $1.20 - 150 tok/s 73.7% - 3. Feb. 2026
OpenAI KI-Anbieter-Logo - o3-mini (high)
#79 o3-mini (high)
von OpenAI
$1.10 / $4.40 80.2% 150 tok/s 77.3% - 31. Jan. 2025
OpenAI KI-Anbieter-Logo - GPT-5 nano (medium)
#80 GPT-5 nano (medium)
von OpenAI
$0.05 / $0.40 77.2% 150 tok/s 67.0% 78.3% 7. Aug. 2025
Mistral KI-Anbieter-Logo - Mistral Small 3.1
#81 Mistral Small 3.1
von Mistral
$0.10 / $0.30 65.9% 149 tok/s 45.4% 3.7% 17. März 2025
Liquid AI KI-Anbieter-Logo - LFM2 24B A2B
#82 LFM2 24B A2B
von Liquid AI
$0.03 / $0.12 - 148 tok/s 47.4% - 25. Feb. 2026
Mistral KI-Anbieter-Logo - Mistral Small 4 (Non-reasoning)
#83 Mistral Small 4 (Non-reasoning)
von Mistral
$0.15 / $0.60 - 147 tok/s 57.1% - 16. März 2026
OpenAI KI-Anbieter-Logo - GPT-5 nano (high)
#84 GPT-5 nano (high)
von OpenAI
$0.05 / $0.40 78.0% 147 tok/s 67.6% 83.7% 7. Aug. 2025
Anthropic KI-Anbieter-Logo - Claude 4.5 Haiku (Reasoning)
#85 Claude 4.5 Haiku (Reasoning)
von Anthropic
$1.00 / $5.00 76.0% 147 tok/s 67.2% 83.7% 15. Okt. 2025
Mistral KI-Anbieter-Logo - Mistral Small (Feb '24)
#86 Mistral Small (Feb '24)
von Mistral
$1.00 / $3.00 41.9% 147 tok/s 30.2% - 26. Feb. 2024
LongCat KI-Anbieter-Logo - LongCat Flash Lite
#87 LongCat Flash Lite
von LongCat
k. A. / k. A. - 146 tok/s 63.6% - 28. Jan. 2026
Alibaba KI-Anbieter-Logo - Qwen3 VL 8B Instruct
#88 Qwen3 VL 8B Instruct
von Alibaba
$0.18 / $0.70 68.6% 144 tok/s 42.7% 27.3% 14. Okt. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 35B A3B (Reasoning)
#89 Qwen3.5 35B A3B (Reasoning)
von Alibaba
$0.25 / $2.00 - 143 tok/s 84.5% - 24. Feb. 2026
Amazon KI-Anbieter-Logo - Nova 2.0 Pro Preview (medium)
#90 Nova 2.0 Pro Preview (medium)
von Amazon
$1.25 / $10.00 83.0% 142 tok/s 78.5% 89.0% 27. Nov. 2025
Google KI-Anbieter-Logo - Gemini 3 Pro Preview (high)
#91 Gemini 3 Pro Preview (high)
von Google
$2.00 / $12.00 89.8% 141 tok/s 90.8% 95.7% 18. Nov. 2025
Xiaomi KI-Anbieter-Logo - MiMo-V2-Flash (Non-reasoning)
#92 MiMo-V2-Flash (Non-reasoning)
von Xiaomi
$0.10 / $0.30 74.4% 141 tok/s 65.6% 67.7% 16. Dez. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 9B (Non-reasoning)
#93 Qwen3.5 9B (Non-reasoning)
von Alibaba
$0.04 / $0.20 - 141 tok/s 78.6% - 2. März 2026
OpenAI KI-Anbieter-Logo - GPT-5 nano (minimal)
#94 GPT-5 nano (minimal)
von OpenAI
$0.05 / $0.40 55.6% 141 tok/s 42.8% 27.3% 7. Aug. 2025
Mistral KI-Anbieter-Logo - Devstral Medium
#95 Devstral Medium
von Mistral
$0.40 / $2.00 70.8% 140 tok/s 49.2% 4.7% 10. Juli 2025
Alibaba KI-Anbieter-Logo - Qwen3 1.7B (Non-reasoning)
#96 Qwen3 1.7B (Non-reasoning)
von Alibaba
$0.11 / $0.42 41.1% 139 tok/s 28.3% 7.3% 28. Apr. 2025
Alibaba KI-Anbieter-Logo - Qwen3 1.7B (Reasoning)
#97 Qwen3 1.7B (Reasoning)
von Alibaba
$0.11 / $1.26 57.0% 138 tok/s 35.6% 38.7% 28. Apr. 2025
Alibaba KI-Anbieter-Logo - Qwen3.5 35B A3B (Non-reasoning)
#98 Qwen3.5 35B A3B (Non-reasoning)
von Alibaba
$0.25 / $2.00 - 138 tok/s 81.9% - 24. Feb. 2026
OpenAI KI-Anbieter-Logo - o4-mini (high)
#99 o4-mini (high)
von OpenAI
$1.10 / $4.40 83.2% 137 tok/s 78.4% 90.7% 16. Apr. 2025
Z AI KI-Anbieter-Logo - GLM-4.7-Flash (Non-reasoning)
#100 GLM-4.7-Flash (Non-reasoning)
von Z AI
$0.07 / $0.40 - 135 tok/s 45.2% - 19. Jan. 2026

Zeige 100 von 477 Modelle

EU Made in Europe

Chat with 100+ AI Models in one App.

Use Claude, ChatGPT, Gemini alongside with EU-Hosted Models like Deepseek, GLM-5, Kimi K2.5 and many more.

Das KI-Modell-Leaderboard verstehen

Dieses umfassende KI-Modell-Leaderboard hilft Ihnen, zu vergleichen und auszuwählen die besten Large Language Models (LLMs) für Ihre Anforderungen. Wir erfassen standardisierte KI-Benchmarks, Token-Preise, Inference-Geschwindigkeit und Modellfähigkeiten bei allen großen KI-Anbietern wie OpenAI, Anthropic, Google, Meta, und DeepSeek.

Kern-KI-Benchmarks erklärt

MMLU-Pro Testet breites Wissen über 14 akademische Fachbereiche
GPQA Denken & Problemlösung auf Promotionsniveau
AIME 2025 Mathematisches Denken auf Spitzenniveau
Coding Index LiveCodeBench + SciCode kombiniert
Math Index AIME + MATH-500 kombiniert

Wichtige Kennzahlen

Token-Preisgestaltung Input- vs. Output-Kosten pro 1 Mio. Tokens
Inference-Geschwindigkeit Tokens/Sekunde für Antwortzeit
Veröffentlichungsdatum Neueste Techniken & Wissensstand
Benchmark-Scores Fähigkeitsvergleich von 0-100 %

So wählen Sie das richtige KI-Modell für Ihren Use Case

Für Forschung & Analyse

Priorisieren Sie Modelle mit hohen MMLU-Pro- (70 %+) und GPQA-Werten (60 %+), wenn es um komplexe Denkaufgaben, wissenschaftliche Recherche und technische Dokumentation geht

Für Kostenoptimierung

Sortieren Sie nach Input-/Output-Preisen - kleinere Modelle liefern bei einfachen Aufgaben oft 80 % der Flaggschiff-Leistung zu 10 % der Kosten

Für Mathe & MINT

Filtern Sie nach Math-Index oder AIME-2025-Scores (50 %+) für quantitative Analysen, Engineering-Berechnungen und wissenschaftliche Anwendungen

Alle Benchmark-Scores und Preisdaten werden täglich von Artificial Analysis aktualisiert, um die neuesten Modellversionen und Fähigkeiten abzubilden. Nutzen Sie die Sortierfilter oben, um KI-Modelle nach Intelligenz, Kosten, Coding-Fähigkeit, Mathe-Leistung, Geschwindigkeit oder Veröffentlichungsdatum zu finden.

Häufig gestellte Fragen

Was ist MMLU-Pro und warum gilt es als Standard-Benchmark für KI-Intelligenz?

MMLU-Pro (Massive Multitask Language Understanding - Professional) ist der umfassendste KI-Benchmark und testet Modelle in 14 akademischen Fachbereichen, darunter Mathematik, Naturwissenschaften, Geschichte, Recht und Ethik. Die Werte reichen von 46 % (Grundkompetenz) bis 87 % (nahe Expertenniveau). Modelle über 75 % zeigen starke allgemeine Intelligenz für professionelle Anwendungen, während Werte unter 60 % auf Einschränkungen bei komplexen Denkaufgaben hindeuten.

Was misst GPQA und welche Modelle erzielen die höchsten Werte?

GPQA (Graduate-level Google-Proof Q&A) prüft Denken auf Promotionsniveau mit Fragen, die bewusst "Google-proof" sind - sie erfordern tiefes Verständnis statt bloßer Faktenrecherche. Spitzenmodelle wie GPT-5.1 (87,3 %), GPT-5 mini (82,8 %) und o3 (82,7 %) sind bei GPQA besonders stark und eignen sich für Forschung, technische Analysen und komplexe Problemlösung. Modelle unter 50 % GPQA haben oft Schwierigkeiten bei anspruchsvollem Denken und liefern eher oberflächliche Antworten.

Was ist AIME 2025 und wie bewertet es die mathematischen Fähigkeiten von KI?

AIME 2025 (American Invitational Mathematics Examination) ist ein Benchmark auf Wettbewerbsniveau, der fortgeschrittene Problemlösung, Algebra, Geometrie und Zahlentheorie testet. Werte über 80 % (wie GPT-5 Codex mit 98,7 % oder GPT-5.1 mit 94 %) zeigen außergewöhnliches mathematisches Denken für Engineering, Scientific Computing und quantitative Analysen. Modelle unter 50 % können bei mehrstufigen mathematischen Aufgaben Probleme haben oder benötigen eine explizite Aufschlüsselung.

Wie wird die Preisgestaltung von KI-Modellen berechnet und was gilt als kosteneffizient?

Die Preise von KI-Modellen werden pro 1 Million Tokens berechnet (etwa 750.000 Wörter). Input-Preise betreffen den Text, den Sie senden, Output-Preise die generierten Antworten. Günstige Modelle wie Llama 3.3 70B kosten $0.54/$0.71 pro Million Tokens, Mid-Tier-Modelle wie GPT-5 nano $0.05/$0.40, Premium-Modelle wie GPT-5 $1.25/$10. Bei typischen Anwendungen mit einem Input-/Output-Verhältnis von 3:1 können Budget-Modelle 10- bis 20-mal günstiger sein und dennoch 70-80 % der Leistung liefern.

Welche KI-Modelle eignen sich am besten für Coding und Programmierung?

Sortieren Sie nach Coding Index um die besten Programmiermodelle zu sehen. Unser Coding Index kombiniert LiveCodeBench, SciCode und Coding-Benchmarks. Zu den Top-Performern gehören GPT-5.1 (57,5), GPT-5 mini (51,4) und GPT-5 Codex (53,5). Diese Modelle sind stark bei Codegenerierung, Debugging, Refactoring und der Erklärung komplexer Algorithmen. Für kostenbewusste Entwickler bieten Modelle mit 40+ Punkten im Coding Index ein sehr gutes Preis-Leistungs-Verhältnis für Routineaufgaben.

Wie oft werden KI-Modell-Benchmarks und Rankings aktualisiert?

Unser Leaderboard wird täglich mit der Artificial Analysis API synchronisiert, damit Benchmark-Scores (MMLU-Pro, GPQA, AIME 2025), Preise und Inference-Geschwindigkeit die neuesten Modellversionen widerspiegeln. Neue Modell-Releases erscheinen sofort unter der Sortierung "Neueste". Benchmark-Scores können sich ändern, wenn Anbieter aktualisierte Versionen veröffentlichen - zum Beispiel erreichte GPT-5.1 (veröffentlicht im November 2025) 69,7 Intelligenzpunkte gegenüber 68,5 bei GPT-5 aus August 2025.

Welche Inference-Geschwindigkeit (Tokens/Sekunde) brauche ich für meine Anwendung?

Die Inference-Geschwindigkeit bestimmt, wie schnell Modelle Antworten erzeugen. Für Echtzeit-Chatbots und interaktive Anwendungen sind 100+ Tokens/Sekunde sinnvoll (z. B. gpt-oss-120B mit 340 tok/s). Für Hintergrundverarbeitung und Batch-Jobs reichen 50-100 tok/s. Premium-Reasoning-Modelle wie GPT-5 (103 tok/s) balancieren Geschwindigkeit und Fähigkeiten. Wichtig: Höhere Geschwindigkeit bedeutet nicht automatisch bessere Qualität - langsamere Modelle liefern oft durchdachtere, detailliertere Antworten.

Kann ich diese KI-Modelle kostenlos testen, bevor ich mich entscheide?

Ja! Probieren Sie unsere kostenlose KI-Chatoberfläche aus, um verschiedene Modelle sofort ohne Account zu testen. Viele Anbieter haben ebenfalls kostenlose Stufen: OpenAI (ChatGPT mit Tageslimits), Anthropic (Claude mit Nutzungslimits), Google (Gemini Free Tier) und Open-Source-Modelle wie Llama 3.3. Vergleichen Sie die Leistung für Ihren konkreten Use Case, bevor Sie auf bezahlte Pläne wechseln.

Kundensupport