Duben 2026 · Aktuální data

Srovnání AI modelů
Cena vs. Výkon

Přehled nejdůležitějších modelů — od rozpočtových po špičkové

Model Vrstva SWE-bench ↑ GPQA ↑ Cena (vstup/výstup / 1M tokenů) Nejlepší pro Soukromí / GDPR Hodnota
Claude Haiku 4.5
Anthropic
Rozpočtový
73 %
~72 %
$1 / $5
ChatbotKlasifikaceRychlé odpovědi
⚠️ USA cloudOpt-out trénink
9.5
Claude Sonnet 4.6
Anthropic
Střední
79,6 %
~74 %
$3 / $15
KódováníPsaníAnalýzaAgenti
⚠️ USA cloudOpt-out trénink
9.2
Claude Opus 4.6
Anthropic
Špičkový
80,8 %
91,3 %
$5 / $25
VědaSložité úlohy1M kontext
⚠️ USA cloudOpt-out trénink
7.8
GPT-5 Nano
OpenAI
Rozpočtový
~60 %
~65 %
$0,05 / $0,40
Hromadné zpracováníJednoduchá extrakce
⚠️ USA cloud❌ Trénink dat
9.8
GPT-4o Mini
OpenAI
Střední
~68 %
~70 %
$0,15 / $0,60
MultimodálníEfektivní API
⚠️ USA cloud❌ Trénink dat
9.4
GPT-5.4
OpenAI
Špičkový
74,9 %
92,8 %
$2,50 / $15
Vše-v-jednomAudio+VizePluginy
⚠️ USA cloudEnterprise opt-out
8.5
Gemini 3.1 Flash-Lite
Google
Rozpočtový
~55 %
~60 %
$0,25 / $1,50
Hromadné APIŠkálování
⚠️ USA cloud❌ Google trénink
9.6
Gemini 3.1 Pro
Google
Špičkový
78,8 %
94,3 % 🏆
$2 / $12
Věda/VýzkumVideo+Audio1M kontext
⚠️ USA cloudGoogle Workspace
9.0
Grok 4
xAI
Špičkový
75 % 🏆
~80 %
$2 / $15
KódováníReal-time X data
❌ USA / xAI cloud❌ X/Twitter data
8.2
DeepSeek V4
DeepSeek
Open-source
~77 %
~75 %
$0,28 / ~$1
Úspora nákladůOpen-source1T parametrů
❌ Čína / servery CN✓ Self-host možný
9.9
Llama 4 Maverick
Meta (open)
Open-source
~72 %
~68 %
Zdarma (self-host)
Privátní nasazeníOn-premise
✅ Self-host✅ Plná kontrola dat
10
Mistral Small 3.1
Mistral AI (EU)
Rozpočtový
~60 %
~62 %
$0,20 / $0,60
Hromadné úlohyEU projekty
✅ EU servery✅ GDPR nativní
9.3
Mistral Medium 3
Mistral AI (EU)
Střední
~70 %
~72 %
$0,40 / $2
KódováníSTEMEnterprise
✅ EU servery✅ GDPR nativníSelf-host možný
9.5
Mistral Large 3
Mistral AI (EU)
Open / Špičkový
~77 %
~75 %
$0,50 / $1,50
AnalýzaKreativita256K kontext
✅ EU / Apache 2.0✅ GDPR nativní✅ Self-host možný
9.7
Claude (Anthropic)
OpenAI
Google
xAI (Grok)
DeepSeek
Mistral AI (EU)
Meta

Zdroje: Anthropic, OpenAI, Google, SWE-bench, GPQA Diamond, Artificial Analysis · Duben 2026
Hodnota = subjektivní skóre výkon÷cena (1–10). SWE-bench = schopnost řešit reálné GitHub problémy. GPQA = doktorátské vědecké otázky.