Přehled AI modelů a můj názor
Trh s AI se mění každý týden a vyznat se v tom, které modely používat k čemu (a které rovnou zahodit), je složité. Zde najdete reálné zkušenosti z každodenní praxe, k čemu se daná umělá inteligence aktuálně hodí nejlépe, její přednosti i brutální limity.
Claude Opus 4.7
Aktuální top-tier model od Anthropicu a de-facto standard pro seriózní programátorskou práci. Integrován v Cursor IDE (Composer 2), Claude Desktop, Claude Code CLI a přes Anthropic API. Na rozdíl od ChatGPT nemá silný "robotický" styl, je chirurgicky přesný k instrukcím a umí v češtině psát jako elitní copywriter.
🧬 Varianty v rodině Claude
✅ V čem exceluje
- Programování (Composer 2 v Cursoru): Naprosto brilantní. Chápe strukturu obřích monorepů, udrží stovky souborů v hlavě a navrhuje architekturu lépe než mnozí senioři. S režimem "Thinking High/Max" prakticky neselhává u složitých refactorů.
- Tvorba textů a copywriting v češtině: Nepíše korporátní "omáčku" a klišé. Z trojky Opus/GPT/Gemini zní pro český trh nejlidštěji.
- Mega-kontext (až 1M tokenů): Nahrajte celou knihu, legislativu nebo firemní dokumentaci — udrží to všechno najednou.
- Artifacts & Skills: Živé HTML/React aplikace, grafy, dashboardy, SVG ikony přímo v prohlížeči. Funkce "Skills" umí na vyžádání zapnout specializované režimy.
- Agentní práce (Computer Use): Přes API umí ovládat myš/klávesnici a procházet web jako člověk.
❌ Čemu se vyhnout (Zklamání)
- Alignment / Moralizování: Anthropic jede nejpřísnější bezpečnostní politiku z velké trojky. Občas "poučuje" a odmítá i nekontroverzní úkoly, dokud neupravíte prompt.
- Cena plného Opusu: Přes API je to jeden z nejdražších modelů ($15 input / $75 output za M tokenů). Limity v Claude Pro ($20/měs) vyčerpáte za pár hodin intenzivní práce.
- Real-time web: Sám od sebe nehledá na webu — potřebuje plugin/MCP nebo integraci v Cursoru, Perplexity apod.
- Generování obrázků/videa: Žádné. Claude zůstává čistě textový + kódový model.
💡 Ultimátní využití v praxi
Vývoj softwaru v Cursor IDE s Composer 2 (nejlepší poměr výsledku k námaze), psaní knih, delších článků a prodejních textů, rozbor smluv a legislativy, tvorba komplexních HTML dashboardů přes Artifacts. Pro masivní refactory zapněte effort: Max + 1M kontext.
ChatGPT (GPT-5.4 a o-series)
Nejširší AI ekosystém na planetě. GPT-5.4 je vlajková loď v pěti úrovních inteligence (Auto → Max), která kombinuje klasický chat, Thinking režim, nativní obraz (DALL-E nástupce), video (Sora 2), hlas a Deep Research do jedné aplikace. Zlatý standard, od kterého to všechno v roce 2022 začalo.
🧬 Rodina modelů a nástrojů OpenAI
✅ V čem exceluje
- Voice Mode (Multimodální Realtime): Nejplynulejší hlasový asistent na trhu. Vidí svět přes kameru mobilu v reálném čase, reaguje na emoce, umí zpívat, přerušovat se a střídat styly. Zabiják pro trénink cizích jazyků.
- Generování obrázků a videa: GPT Image 1 drtí konkurenci v čitelnosti textu na obrázku. Sora 2 je jeden ze dvou nejlepších video-generátorů na světě.
- Deep Research: Agent, který sám půl hodiny prochází web a vrátí vám plnohodnotný report s desítkami citací — jako byste si najali analytika.
- Advanced Data Analysis: Nahrajte obří .xlsx / .csv / Parquet a GPT-5.4 v nich najde anomálie, spočítá pivotky a nakreslí publikační grafy.
- Codex / Agent mode: Autonomní agent, který si sám ovládá prohlížeč a terminál — objedná letenku, udělá rešerši, napíše a spustí kód.
❌ Čemu se vyhnout (Zklamání)
- "ChatGPT sloh": Přes obrovskou inteligenci stále nadužívá fráze "fascinující", "nepřekonatelný", "v dnešní době", "závěrem". V češtině zní korporátně, pokud ho v promptu tvrdě neukočírujete.
- Tvrdohlavost a "sycophancy": Když se vydá špatným směrem, raději si vymyslí vysvětlení, než by přiznal chybu. Současně až přehnaně souhlasí s uživatelem ("Skvělá otázka!").
- Cena Pro plánu: Přístup k plné "Max" inteligenci a neomezenému Sora 2 stojí $200/měsíc. Free a Plus verze vás rychle hodí na slabší model.
- Rate limity u Thinking modelů: o3 Max má v Plusu velmi nízký týdenní limit — pro seriózní práci potřebujete Pro.
💡 Ultimátní využití v praxi
Hlasová asistence na mobilu (výuka jazyků, navigace při práci rukama), datová analýza Excelů a PDF, generování obrázků a krátkých videí pro marketing, Deep Research pro disertačky a obchodní analýzy, řešení extrémně složitých úloh pomocí o3 / o4 Thinking.
Google Gemini (3.1 Pro) 🏆 Můj Favorit
Největší zbraň Googlu. Gemini 3.1 Pro má kontext až 2 milionů tokenů (stovky knih / desítky hodin videa najednou), nativně rozumí video i audio signálu a jako jediný model žije přímo ve vašem Google ekosystému (Gmail, Docs, Drive, Meet). K tomu má pod sebou legendární Nano Banana pro editaci obrázků a Veo 3 pro video — obojí aktuálně nejlepší na trhu.
🧬 Rodina Gemini + generativní modely Googlu
✅ V čem exceluje
- YouTube extrakce (unikátní výhoda): Google vlastní YouTube — Gemini jediný umí stáhnout 3hodinové video a vrátit přesné timestampy, přepis i shrnutí. Žádná konkurence to neumí.
- Extrémní kontext (2M tokenů): Nahrajete stovky PDF nebo celý zdrojový kód středně velké aplikace najednou a ptáte se na detaily.
- Nano Banana: Nejlepší editor obrázků vůbec. Zachovává identitu postavy, umí vyměnit pozadí, změnit oblečení, přidat/odebrat objekty — vše v jednom prompt řetězci.
- Veo 3 (Video s audiem): Generuje video s nativním hlasem, dialogy i zvukovými efekty. Pro reklamy a prototypy klipů první volba.
- Google Workspace: "Najdi fakturu z Gmailu a shrň podmínky storna z PDF", "Udělej prezentaci ze článků v Drive". Žádný model nemá takovou hloubku integrace.
❌ Čemu se vyhnout (Zklamání)
- Přehnaná opatrnost (Safety filtry): Google jede historicky nejpřísnější cenzuru. Občas odmítne nevinnou věc, vrací "I can't help with that" bez vysvětlení.
- Občas ztratí nit v detailu: Udrží v hlavě tisíce stránek, ale někdy klopýtne na drobné logické operaci, kterou Opus zvládne levou zadní.
- Slabší "copywriter feeling": V češtině zní o trochu robotičtěji než Claude. Je spíš analytik než básník.
- AI Ultra cena: Plný přístup k Deep Think + Veo 3 + Nano Banana bez limitů stojí $250/měs — dražší než ChatGPT Pro.
💡 Ultimátní využití v praxi
Shrnutí dlouhých YouTube videí a přednášek, analýza gigantických PDF nebo zdrojových kódů, editace fotek přes Nano Banana (rodinné fotky, produkty, postavy), generování reklamních videí přes Veo 3, vyhledávání napříč Google Drive a Gmailem.
Grok 4.20 / Grok 4.1 Fast
Grok od xAI vyrostl z "vtipálka" na síti X na seriózního konkurenta. Grok 4.20 (vlajková loď) drtí benchmarky v matematice a vědě, zatímco Grok 4.1 Fast je nejlepší volba pro agentní práci a nástroje. Vyniká bezprecedentním přístupem k real-time datům ze sítě X, drzým tónem bez korporátního glajchšaltu a ekosystémem Imagine (video) + Aurora (obraz).
🧬 Rodina Grok + ekosystém xAI
✅ V čem exceluje
- Realtime data ze sítě X: Žádný model neví o tom, co se stalo před 3 minutami, tolik co Grok. Pro traderování, breaking news, monitoring značky nebo sledování trendů nenahraditelný.
- Matematika a reasoning (Heavy mode): Na Humanity's Last Exam a ARC-AGI patří Grok 4 Heavy mezi absolutní špičku — v některých testech překonává GPT-5 i Gemini Deep Think.
- Zero korporátní cenzura: Odpoví na politicky nekorektní dotazy, pracuje s kontroverzními tématy, umí sarkasmus a černý humor. Bez "I can't help with that".
- Aurora + Imagine: Nejvolnější generátory obrazu a videa. Fotorealistické výsledky bez filtrů, které blokují polovinu promptů v DALL-E/Imagen.
- 2M kontext u Fast verze: Srovnatelné s Gemini, ale za zlomek ceny přes API.
❌ Čemu se vyhnout (Zklamání)
- Český jazyk: V češtině píše méně přirozeně než Opus nebo Gemini. Pro copywriting zůstává druhá volba.
- Občasné kontroverze: Díky volné kalibraci se občas utrhne ze řetězu a produkuje výroky, kvůli kterým xAI musel zasahovat. Pro firemní nasazení je třeba prompty hlídat.
- Silná vazba na X: Nejlepší zážitek máte jen přes předplatné platformy X (Premium+ nebo SuperGrok). Samostatná webová appka grok.com zaostává.
- Slabší ekosystém integrací: Oproti ChatGPT (Projects, Custom GPTs) nebo Gemini (Workspace) je Grok stále spíš "chatbot", méně platforma.
💡 Ultimátní využití v praxi
Monitoring trendů a breaking news v reálném čase, traderská rešerše, uvolněný a sarkastický copywriting pro sociální sítě, generování obrázků a videí bez omezení (Aurora / Imagine), řešení těžkých vědeckých úloh přes Grok 4 Heavy, a jakékoliv úkoly, kde vás ostatní AI blokují kvůli přehnané cenzuře.
Composer 2 (Cursor IDE)
Composer je vlastní "frontier" coding model od týmu Cursoru — trénovaný specificky na softwarovém inženýrství a agentních tool-use úlohách. Není to samostatný chatbot, ale ultra-rychlý agent zapečený přímo do Cursor IDE. Generuje kód 4× rychleji než konkurence srovnatelné kvality a je ideální pro agentní smyčky "mysli → změň soubory → spusť testy → oprav".
✅ V čem exceluje
- Rychlost: Drtivě nejrychlejší agent. Většinu změn dotáhne pod 30 sekund, zatímco Opus Thinking klidně chroupe 5 minut.
- Tool-use smyčky: Je trénovaný na používání nástrojů (čtení souborů, grep, spuštění testů, git). Nehalucinuje na jmenech funkcí, protože si je pokaždé ověří.
- Hluboká integrace v IDE: Rozumí kontextu otevřených tabů, kurzoru, terminálu. Nemá jazykovou bariéru mezi chatem a editorem.
- Zdarma v Cursor Pro: Model Composer 2 neubírá z limitů prémiových modelů.
- Všechny top modely pod jednou střechou: Přes Cursor Pro si můžete přepínat mezi nejdražšími modely na světě (Opus 4.7, GPT-5.4, Gemini 3.1, Grok) v rámci jednoho předplatného. Odpadá tak nutnost platit tisíce korun měsíčně za každé AI zvlášť — tady si všechny můžete sami otestovat v praxi.
❌ Čemu se vyhnout (Zklamání)
- Ne vždy nejchytřejší: Pro nejsložitější architektonické rozhodnutí nebo nemilosrdný refactor sáhněte po Opusu 4.7 Max.
- Pouze v Cursoru: Nemůžete si ho stáhnout ani volat přes API mimo Cursor IDE.
- Nehodí se na psaní textů: Je to coding specialista, ne copywriter.
💡 Ultimátní využití v praxi
Defaultní volba pro 80 % úkolů v Cursor IDE: přidání funkce, oprava bugu, refactor souboru, spouštění testů v smyčce. Na těch zbylých 20 % (architektura, brutálně složitá logika) přepněte na Opus 4.7 Max.
Perplexity (Sonar / Comet)
Perplexity není vlastní LLM (interně používá kombinaci GPT, Claude, Gemini a vlastní Sonar), ale ultimátní obálka pro webové vyhledávání. Každá odpověď je podložená citacemi, zdroji a možností rozkliknout, odkud to AI vzalo. Součástí je i prohlížeč Comet s vestavěným AI asistentem.
🧬 Klíčové produkty Perplexity
✅ V čem exceluje
- Citace u každé věty: Nikdy se nemusíte bát halucinací — každý fakt vede na konkrétní URL.
- Výběr modelu backendu: V Pro plánu si zapnete Claude Opus, GPT-5 nebo Gemini 3 — podle toho, co máte radši.
- Deep Research: Nejlepší nástroj pro nákupní rozhodnutí, rešerši konkurence, vědecké rešerše.
❌ Čemu se vyhnout
- Není to generátor: Neslouží k psaní dlouhých textů nebo kódování — je to vyhledávač.
- Závislost na zdrojích: Pokud téma není na webu dobře pokryté, výsledky jsou slabé.
💡 Ultimátní využití v praxi
Nahradí Google pro téměř všechny "ptací" úkoly: nákupní rozhodnutí, porovnávání produktů, rešerše konkurence, aktuální informace ze světa, hledání zdrojů k článku.
Midjourney v7 + Video
Midjourney zůstává zlatým standardem pro umělecké a stylizované vizuály. Verze 7 přinesla personalizaci (moodboards, style codes), Draft Mode pro rychlé iterace a rovněž video generátor. Pro art-direction a reklamní kampaně stále první volba.
🧬 Klíčové funkce Midjourney
✅ V čem exceluje
- Estetika a art direction: Nikdo jiný nezvládne výtvarně tak soudržné obrázky jako MJ.
- Personalizace stylu: Moodboards + style codes z vás udělají "art direktora" s vlastním DNA.
❌ Čemu se vyhnout
- Text v obrázku: Oproti GPT Image nebo Nano Banana neumí dobře nápisy a loga.
- Editace existujících fotek: Pro zachování identity postavy je Nano Banana lepší.
💡 Ultimátní využití v praxi
Hero vizuály pro web, obálky článků, reklamní kampaně, concept art, personalizovaný umělecký styl pro značku.
Google NotebookLM
Tohle není běžný chatbot. Jde o specializovaný produkt postavený na Gemini, který pracuje výhradně s tím, co mu vy sami nahrajete jako zdroj. Tím prakticky odstraňuje strach z toho, že si AI něco vymyslí (halucinuje).
✅ V čem exceluje
- Nulové halucinace u práce s daty: Nahrajete PDF smlouvy, knihu nebo skripta do školy a on odpovídá POUZE z nich. S dokonalými citacemi.
- Audiopodcast ze skript (Audio Overview): Jedna z nejlepších funkcí na světě. Nahrajete mu nudný 50stránkový zákon a on z toho pro vás jedním kliknutím vytvoří poutavý americký 10minutový konverzační podcast dvou hlasatelů, kteří si o tom úžasně povídají.
❌ Čemu se vyhnout (Zklamání)
- Není pro volný pokec: Neslouží jako klasický asistent pro hledání na internetu a kódování. Nemůžete s ním prostě jen tak tlachat o všem možném (vypíše, že to v nahraných zdrojích nenašel).
💡 Ultimátní využití v praxi
Příprava studentů na maturitu nebo státnice z poskytnutých skript, extrakce poznatků z PDF souborů a generování amerického podcastu k poslechu při vaření nebo do auta z vlastní práce.
DeepSeek V3.2 / R2
Čínský open-source model, který v lednu 2026 otřásl americkou AI dominancí. Verze V3.2 používá efektivní MoE architekturu (671B parametrů, aktivních 37B) a přichází s "Sparse Attention" pro levnější dlouhý kontext. R2 je nástupce slavného R1 — thinking model ve stylu o-series OpenAI. Open-source, lokálně spustitelný, absurdně levný přes API.
🧬 Rodina DeepSeek
✅ V čem exceluje
- Logika, matematika a kód (R2): Brutální výkon v algoritmických úlohách a matematice. Konkurence schopný s o3 a Gemini Deep Think za desetinu ceny.
- Open-source a lokální běh: Stáhnete si weights a spustíte doma nebo ve firemní infra. Nic neposíláte do USA/Číny.
- Cena API: Absurdně levné. Projekt, který by stál $500 na OpenAI API, tady zaplatíte $30. Donutilo to i americkou konkurenci zlevnit.
- Méně západních filtrů: Na technické a kreativní úkoly neprotestuje tak často jako Claude nebo Gemini.
❌ Čemu se vyhnout (Zklamání)
- Čínská cenzura: Na oficiálním chatu odmítá politicky citlivá témata (Tchaj-wan, Tiananmen, Si Ťin-pching). Lokální self-hosted verze to částečně obcházejí.
- Výpadky oficiální služby: Chat.deepseek.com je kvůli popularitě a infrastrukturnímu tlaku často nedostupný.
- Slabší v češtině: Hlavní zaměření je angličtina a čínština. Čeština funguje, ale není to lidské psaní jako Opus.
- Žádný obraz/video ekosystém: Čistě textový a coding model, bez vlastního generátoru vizuálů.
💡 Ultimátní využití v praxi
Pro vývojáře, kteří chtějí kvalitní AI lokálně (Ollama / LM Studio) nebo za zlomek ceny přes API. Ideální pro bulk zpracování, interní firemní asistenty bez posílání dat ven, a pro studenty matematiky/fyziky, kteří potřebují "thinking" model zdarma.
🎯 Jaký je můj doporučený stack pro rok 2026
Pokud jedete celé spektrum práce (kód + text + vizuál + rešerše) a chcete absolutní maximum z praxe, tohle je kombinace, kterou sám nejvíc používám a doporučuji:
🏆 Můj každodenní "Go-To" Stack
- Základ pro všechno (Texty, analýzy, obrázky): Google Gemini (3.1 Pro). Tohle je aktuální vítěz. Umí generovat rovnou i luxusní obrázky (přes Nano Banana), nemá výkyvy v kvalitě odpovědí (drží si neustále svůj vysoký standard) a je extrémně všestranný. Poznámka k AI konkurenci: Claude Opus 4.7 je sice chytrý, ale nehorázně drahý a příšerně rychle "vyžere" tokenové limity. Gemini 3.1 Pro je jistota, která vás nenechá ve štychu.
- Programování a vývoj: Cursor IDE s Composer 2. Nepřekonatelný agentní workflow pro úpravu reálného kódu a projektů. V Cursoru mám navolené různé modely podle nálady, ale pro rychlou práci je vestavěný Composer jasná jednička. Navíc v placené verzi (Cursor Pro) si můžete pod jednou střechou snadno "osahat" a přepínat mezi nejdražšími modely (Opus 4.7, GPT-5.4, Gemini 3.1 Pro), aniž byste museli platit tisíce korun za jednotlivá předplatná. Ideální testovací prostředí pro všechny!
- Když potřebuju specifickou "třešničku na dortu":
- Realtime informace & trendy: Grok 4.20 kvůli nepřekonatelnému přístupu přímo k živému X streamu.
- Rešerše s citacemi (Místo Googlu): Perplexity Pro.
- Studium z PDF / Skript: Google NotebookLM (nula halucinací + úžasné audio podcasty z textu).
- Umělecká a reklamní kampaň: Midjourney v7 pro "high-end" art direction.