Suno v5 vs v5.5: co se změnilo ve zvuku

Plný český převod analýzy MasterForge (březen 2026, cca 15 min čtení v originále): pět skladeb napříč žánry, stejné stylové prompty, exclude seznamy, Weirdness a Style, bez audio seedů. U každé dvojice čtyři generace na verzi, k analýze vybrána nejbližší dvojice. Metoda: Python, scipy.signal.stft (nperseg=4096, u 48 kHz cca 11,7 Hz rozlišení), středních 60 % délky klipu (bez úvodů/závěrů), M/S rozklad. Neřízený A/B kodeku — dva různé „výkony“ se stejným zadáním; aranž se mezi generacemi může lišit, autoři kompenzují spektrální charakteristikami.

Zdroj: Suno v5 vs v5.5: What Actually Changed in the Audio? — Petri Korhonen, MasterForge. Obrázky níže: export z jejich článku (PNG/JPEG v repu). Tabulky a čísla odpovídají originálu k datu publikace.

Skladby v testu

Glass River — piano balada, 2 hlasy, 72 BPM. District — indie rock, 3–4 hlasy, 128 BPM. Iron Doctrine — thrash metal, 5+ hlasů, 168 BPM. Reactor Core — hard techno, 3–4 hlasy, 148 BPM. Count the Days — dark hip-hop, 2–3 hlasy, 85 BPM.

Proč „shimmer“ sám o sobě klame

Metrika shimmer (podíl energie cca 6–14 kHz) u pěti skladeb u něčeho klesla, u něčeho stoupla. Kdyby ses dívala jen na ni, mohla bys uzavřít, že v5.5 je „smíšený“ — dvě skladby lepší, tři horší. Iron Doctrine (hustý thrash, 5+ hlasů, double bass, scream): v5 shimmer cca 3,48 %, u jednoduššího District dokonce 8,49 % — hutný metal „čistší“ než středně složitý rock? To nedává smysl, dokud nepodíváš na spektrum.

Odpověď podle MasterForge: v5 nečistil výšky, ale zabil je — spektrum nad cca 2 kHz padá o 10–15 dB oproti v5.5. Útok činelů, hrana vokálu, šťáva kytary — pryč. v5.5 má shimmer cca 12,45 % (téměř 4× proti v5), ale poslechově prý „konečně jako metal“, ne metal přes polštář. Shimmer nedokáže rozlišit mezi kodekovým šumem a legitimním obsahem ve výškách — u jasných žánrů může být vyšší číslo lepší znak.

Graf shimmer napříč pěti skladbami v5 vs v5.5
Ilustrace z článku MasterForge (shimmer napříč skladbami).
Spektrální srovnání nebo vizualizace z článku v5 vs v5.5
Druhý obrázek ze série měření v článku (JPEG export).

Skutečný příběh: v5.5 je žánrově adaptivní

Po překonání jedné metriky je vzorec jasný: v5.5 neaplikuje jeden „EQ filtr na všechno“, ale přizpůsobuje spektrum žánru — podobně jako člověk u mixu.

„Memphis“ důkaz u Count the Days

Při stejném promptu v5 prý dodal moderní dark trap; v5.5 interpretaci ve stylu Memphis / Three 6 Mafia — jiný zvukový svět ze stejných slov. Čísla podle článku: sub-bass energie +56,5 %, presence (2–5 kHz) −53,9 %, stereo šířka téměř do mona (−85,9 %), dynamický rozsah (P95–P5 RMS) z cca 15,1 dB na 26,5 dB (+75,5 %) — prý přesně to, co k Memphis estetice patří: těžké 808, tmavší balanc, užší obraz, mezery mezi údery.

Co se zlepšilo napříč boardem

Dynamický rozsah (4 ze 5)

Nejkonzistentnější zlepšení: v5.5 častěji dýchá — méně agresivní „lepení“ kompresí v generátoru, víc kontrastu mezi tichým a hlasitým.

SkladbaDR v5DR v5.5Změna
Glass River19,2 dB17,3 dB−9,9 % (už dynamická)
District5,7 dB9,2 dB+61,4 %
Iron Doctrine6,5 dB7,5 dB+15,4 %
Reactor Core9,4 dB11,1 dB+18,1 %
Count the Days15,1 dB26,5 dB+75,5 %

Bass leak (Side/Mid pod 200 Hz)

Indikátor mono kompatibility — kde na club PA a telefonech záleží, v5.5 často stáhlo únik basy do stran (metal, techno, hip-hop). Výjimka Glass River (+96 %): pravděpodobně realističtější stereo klavír v basu — opět žánrová adaptace.

SkladbaŽánrv5v5.5Změna
Iron DoctrineMetal0,2600,114−56,1 %
Reactor CoreTechno0,0030,002−37,8 %
Count the DaysHip-hop0,0040,003−21,7 %
DistrictRock0,0430,046+6,4 % (stabilní)
Glass RiverPiano0,1990,390+96,0 % (širší bas klavíru)

Presence (2–5 kHz) — časté stažení

v5.5 podle měření systémově stahuje 2–5 kHz u 4 z 5 skladeb (Glass River −84,4 %, District −66,8 %, Count the Days −53,9 %, Reactor Core −30,1 %). Jen Iron Doctrine dostal boost (+48,8 %) — žánr, který agresi potřebuje. Pro mastering často platí: jemný presence boost kolem 3 kHz.

Sub-bass a stereo

Sub-bass přidal ve 4 z 5 případů (Glass River +192 %, Iron Doctrine +123 %, Count the Days +57 %, District +33 %); jen Reactor Core −27 % (jiný charakter kopu). Stereo: 4 z 5 užších ve v5.5 (Count the Days −85,9 %, Glass River −55,4 %, Iron Doctrine −50,9 %); District s promptem na široký obraz +41,9 % — prý výchozí je užší, ale prompt na šířku funguje.

Co nezmizelo: fog

Fog (spektrální plochost cca 400 Hz–2 kHz, „závoj“ ve středech) v5.5 podle tabulek v článku spíš nezlepšilo — většina skladeb mírně horší; jen Reactor Core −11,1 %. Závěr autorů: když máš mlhu ve středech, aranž (méně hlasů, separace pásů) pořád vede — v5.5 chytřeji rozpočítává rozpočet kodeku, ale nezvětšuje ho.

Nejčistší příklad zlepšení: Glass River

Jednoduchá piano balada, 2 hlasy — kde jsou kodekové artefakty nejslyšitelnější. Shimmer klesl z 2,31 % na 1,05 % (−54,8 %), pod úroveň referenční skladby Resonance z jejich Guide A. Poslech: v5 prý šum/hissy pozadí, tenčí zvuk; v5.5 tiché pozadí, čistší transiety, lepší separace nástrojů, plnější teplo.

Otevřené otázky z testu

District: ke konci delší skladby prý v5.5 horší artefakty a šum — středních 60 % analýzy to nemusí zachytit; zůstává otázka „vyčerpání kodeku“ v dlouhých hustých aranžích. Reactor Core: nejmenší subjektivní rozdíl mezi verzemi — techno možná nejméně profituje, nebo syntetické signály už v5 obsloužil kodek dobře.

Co z toho plyne pro mastering

  1. Presence 2–5 kHz — často jemný boost (vokální čitelnost, definice nástrojů).
  2. Sub-bass — víc energie v hloubce = víc soupeření o headroom; HP pod 30–40 Hz, kontrola komprese v subu.
  3. Stereo — default užší; šířku chtít explicitně v promptu; případně M/S na výškách po kontrole mona.
  4. Shimmer — ne slepě de-essovat; u jasných žánrů může být vyšší metrika správně.
  5. Dynamika — lepší DR ve v5.5 = limiter může pracovat přirozeněji.

Upřímný závěr

v5.5 je podle MasterForge opravdové zlepšení, ale ne jako „vše jen čistší“. Model dělá žánrově informovaná rozhodnutí o spektru, dynamice a stereu. Jednoduché aranže profitují měřitelně (méně shimmeru, klidnější pozadí). Hutné jasné žánry dostanou výšky zpět, které v5 utlumoval — metriky vypadají „hůř“, zvuk často lépe. Co to neřeší: fog ve středech — tam pořád platí aranž a rozpočet kodeku.

Příloha: shimmer a dynamika / stereo (z článku)

SkladbaShimmer v5Shimmer v5.5Δ
Glass River2,31 %1,05 %−54,8 %
District8,49 %7,41 %−12,7 %
Iron Doctrine3,48 %12,45 %+257,7 %
Reactor Core4,83 %7,95 %+64,4 %
Count the Days4,71 %5,48 %+16,4 %
SkladbaDR v5DR v5.5Šířka v5Šířka v5.5
Glass River19,2 dB17,3 dB0,2510,112
District5,7 dB9,2 dB0,1230,175
Iron Doctrine6,5 dB7,5 dB0,4600,226
Reactor Core9,4 dB11,1 dB0,0210,014
Count the Days15,1 dB26,5 dB0,0570,008

Spektrální centroid

SkladbaŽánrv5 (Hz)v5.5 (Hz)Směr
Glass Riverpiano ballad2 4141 809↓ cca 25 % tepleji
Districtindie rock4 3813 781↓ cca 14 % tepleji
Iron Doctrinethrash metal3 5785 157↑ cca 44 % jasněji
Reactor Corehard techno3 9094 499↑ cca 15 %
Count the Daysdark hip-hop3 2643 817↑ cca 17 %
Shrnutí pro poslech: měření + uši — metrika sama nestačí. Úplné spektrogramy, PDF a anglický komentář najdeš v originálu.

→ Celý anglický článek včetně PDF a dalších grafů · Zpět na Suno přehled