Duben 2026 · Aktuální data

Srovnání AI modelů
Cena vs. Výkon

Přehled nejdůležitějších modelů — od rozpočtových po špičkové

Model	Vrstva	SWE-bench ↑	GPQA ↑	Cena (vstup/výstup / 1M tokenů)	Nejlepší pro	Soukromí / GDPR	Hodnota
Claude Haiku 4.5 Anthropic	Rozpočtový	73 %	~72 %	$1 / $5	ChatbotKlasifikaceRychlé odpovědi	⚠️ USA cloudOpt-out trénink	9.5
Claude Sonnet 4.6 Anthropic	Střední	79,6 %	~74 %	$3 / $15	KódováníPsaníAnalýzaAgenti	⚠️ USA cloudOpt-out trénink	9.2
Claude Opus 4.6 Anthropic	Špičkový	80,8 %	91,3 %	$5 / $25	VědaSložité úlohy1M kontext	⚠️ USA cloudOpt-out trénink	7.8
GPT-5 Nano OpenAI	Rozpočtový	~60 %	~65 %	$0,05 / $0,40	Hromadné zpracováníJednoduchá extrakce	⚠️ USA cloud❌ Trénink dat	9.8
GPT-4o Mini OpenAI	Střední	~68 %	~70 %	$0,15 / $0,60	MultimodálníEfektivní API	⚠️ USA cloud❌ Trénink dat	9.4
GPT-5.4 OpenAI	Špičkový	74,9 %	92,8 %	$2,50 / $15	Vše-v-jednomAudio+VizePluginy	⚠️ USA cloudEnterprise opt-out	8.5
Gemini 3.1 Flash-Lite Google	Rozpočtový	~55 %	~60 %	$0,25 / $1,50	Hromadné APIŠkálování	⚠️ USA cloud❌ Google trénink	9.6
Gemini 3.1 Pro Google	Špičkový	78,8 %	94,3 % 🏆	$2 / $12	Věda/VýzkumVideo+Audio1M kontext	⚠️ USA cloudGoogle Workspace	9.0
Grok 4 xAI	Špičkový	75 % 🏆	~80 %	$2 / $15	KódováníReal-time X data	❌ USA / xAI cloud❌ X/Twitter data	8.2
DeepSeek V4 DeepSeek	Open-source	~77 %	~75 %	$0,28 / ~$1	Úspora nákladůOpen-source1T parametrů	❌ Čína / servery CN✓ Self-host možný	9.9
Llama 4 Maverick Meta (open)	Open-source	~72 %	~68 %	Zdarma (self-host)	Privátní nasazeníOn-premise	✅ Self-host✅ Plná kontrola dat	10
Mistral Small 3.1 Mistral AI (EU)	Rozpočtový	~60 %	~62 %	$0,20 / $0,60	Hromadné úlohyEU projekty	✅ EU servery✅ GDPR nativní	9.3
Mistral Medium 3 Mistral AI (EU)	Střední	~70 %	~72 %	$0,40 / $2	KódováníSTEMEnterprise	✅ EU servery✅ GDPR nativníSelf-host možný	9.5
Mistral Large 3 Mistral AI (EU)	Open / Špičkový	~77 %	~75 %	$0,50 / $1,50	AnalýzaKreativita256K kontext	✅ EU / Apache 2.0✅ GDPR nativní✅ Self-host možný	9.7

Claude (Anthropic)

OpenAI

Google

xAI (Grok)

DeepSeek

Mistral AI (EU)

Meta

Zdroje: Anthropic, OpenAI, Google, SWE-bench, GPQA Diamond, Artificial Analysis · Duben 2026
Hodnota = subjektivní skóre výkon÷cena (1–10). SWE-bench = schopnost řešit reálné GitHub problémy. GPQA = doktorátské vědecké otázky.