Potřebuje AI hudba mastering? Ano. A tady je proč.

Plný český převod článku Petra Korhonena (MasterForge, duben 2026). Týká se Suna, Udia a obecně generátorů, které skládají zvuk přes neuronový kodek — výstup často zní v aplikaci „fajn“, ale po nahrání na Spotify/YouTube/autě „nějak divně“: tišeji než komerce, ostré výšky, zvláštní basa.

Zdroj: Does AI Music Need Mastering? (Yes. Here's Why.) — Petri Korhonen. Obrázky níže: CDN MasterForge.

„V Sunu to znělo skvěle“

Stáhneš skladbu, nahraješ ji na stream — a najednou je tišeji než všechno kolem, výšky píchají, basa působí divně, v autě je to horší. Neudělal jsi chybu: generování a mastering jsou dvě práce a generátor dělá jen tu první. Výstup je „nedodělaný“ ne proto, že by AI selhala, ale protože finální příprava pro reálné přehrávače standardně chybí.

Co mastering vlastně je

Analogie z článku: jako u fotky z telefonu — kompozice a barvy můžou být skvělé, ale před publikem se doladí kontrast, ostrost, ořez pro platformu. Mastering dělá totéž pro zvuk: frekvenční balanc (aby nic nebylo příliš ostré ani bahnité), dynamika (aby šly slyšet tiché části a hlasité neclipovaly), hlasitost pro cílovou platformu (Spotify cca −14 LUFS, Apple Music cca −16 LUFS — orientačně podle článku).

U klasické nahrávky je mastering norma. U AI hudby je podle autorů důležitější, protože má specifické problémy, které čistá nahrávka z mikrofonu typicky nemá.

Proč AI hudba potřebuje mastering víc

Suno nenahrává zvuk — predikuje ho: text → pravděpodobnosti zvuku → neuronový kodek (ztrátová komprese). Jako každá komprese zahazuje informaci. Rada „oprav to v promptu“ podle článku nefunguje spolehlivě: slova jako „studio quality“ nejsou spárovaná se skutečným zvukovým procesem v datech; strop kvality dává pipeline, ne magická fráze.

Problémy nejsou „špatný prompt“, ale omezení kodeku. Autori v seriálu popisují tři typické podpisy:

Dobrá zpráva: mastering umí všechny tři podle článku výrazně zmírnit (ne nutně úplně odstranit).

Audio Analyzer — skóre AI Audio Health
Ukázka z článku: přehled skóre a doporučení (MasterForge).
Audio Analyzer — detail problémů
Rozpad metrik a konkrétní oblasti k opravě (MasterForge).

Past hlasitosti (loudness trap)

Přirozená reakce: moje skladba je tišší než hit na Spotify → natáhnu limiter a je vyřešeno. Podle článku se ale stávají dvě věci:

  1. AI výstup je už z generace silně komprimovaný (typicky jen cca 4–6 dB dynamického rozsahu oproti třeba 10–15 dB u profi nahrávky). Další limiter „vmáčkne“ zbytek dýchání — zvuk je plochý, únavný.
  2. Shimmer, fog i bass leak se zesílí stejně jako zbytek signálu — neodstranil jsi je, jen jsou hlasitější.

Třetí háček: Spotify, Apple Music, YouTube atd. normalizují hlasitost k cíli. Když je skladba přebuchnutá, platforma ji stáhne — a ty jsi zbytečně zhoršil dynamiku i artefakty.

Správný směr: nejdřív čistit signál (výšky, středy, basa do mona), teprve potom loudness na cíl platformy s rozumným headroomem — to je přesně role masteringové fáze.

Co mastering u AI hudby zvládne — a co ne

Typicky ano

  • Zmírnit shimmer cíleným EQ / de-essing v pásmu cca 6–14 kHz.
  • Snížit fog jemným spektrálním tvarováním ve středech.
  • Svázat basu do mona pod cca 200 Hz (stabilita na reproduktorech).
  • Nastavit loudness pro cíl (Spotify / Apple / …).
  • Celkový tónální balanc pro přenositelnost (sluchátka, auto, telefon).

Ne „magicky“

  • Nedohoní harmonické detaily, které kodek při generaci zahodil.
  • Nepřekročí rozlišovací strop pipeline (jako upscale bitmapy bez nových pixelů).
  • Nerozdělí nástroje, které byly zmíchané už v jednom AI mixu.
  • Nespraví špatnou aranž — tam pomůže nová generace nebo méně současných hlasů.

Profesionální mastering podle článku typicky sníží závažnost artefaktů o 40–60 % — často rozdíl mezi „okatě AI“ a „překvapivě použitelné“. Strop ale vždycky drží zdroj.

Co můžeš udělat hned (bez drahých pluginů)

  1. Přestaň honit maximální hlasitost limitem před nahráním — platformy stejně srovnají hlasitost; tlačení jen zhorší artefakty a dynamiku.
  2. Poslechni na třech systémech (sluchátka, auto, levná BT bedna) — shimmer, bass leak a fog se chovají jinak na každém.
  3. Použij nástroje myšlené na AI audio — generovaný zvuk má jiný spektrální profil než klasická studiová nahrávka; generické „one click“ služby podle článku často jen zvýší hlasitost a minou side-kanál, fázi a žánrové nuance.

Checklist „producent“ (shrnutí z článku)

→ Anglický originál + demo přehrávače A/B · Suno přehled · 13 skladeb, 13 receptů