MQA-formaat: beter dan cd's?
De streamingdienst Tidal maakt reclame voor hoogwaardige opnamen die beter zouden klinken dan cd’s. Maar het MQA-formaat dat Tidal gebruikt, is zelfs bij deskundigen controversieel. We hebben onderzocht wat daar op klankgebied achter schuilgaat.
De cd is niet erg populair in audiofiele kringen. Het formaat met een samplefrequentie van 44,1 kHz zou niet goed genoeg zijn om alle muzikaal relevante informatie op te slaan. Een woordbreedte van 16 bit kan geluiden niet goed genoeg onderverdelen, zegt men. Daarom zweren audiofielen bij samples van 96 of zelfs 192 kHz met 24 bit. Bij het streamen van dergelijke bestanden zijn echter aanzienlijk hogere bitrates vereist, wat de kosten opdrijft.
Ontwikkelaars uit GrootBrittannië hebben daarom een nieuw formaat ontworpen met de naam ‘Master Quality Authenticated’ (MQA). Aan de ene kant is het compatibel met de cd en kan het worden afgespeeld met elke software die WAVbestanden of FLAC afspeelt. Met een speciale decoder bereikt MQA echter een veel betere geluidskwaliteit, die voldoet aan
audiofiele eisen. Tidal streamt MQAbestanden in een 48 kHz, 24bit FLACcontainer die een gegevensstroom produceert van gemiddeld 1300 kbit/s, ongeveer twee keer zo veel als een met FLAC gecomprimeerde audiocd. De daarin verpakte MQAalbums op Tidal gebruiken meestal samplerates tot 96 kHz.
Als je MQAstreams wilt ontvangen, moet je bij Tidal maandelijks 20 euro betalen, anders krijg je ‘slechts’ AACstreams met 320 kbit/s. De MQAalbums worden speciaal gemarkeerd. Je kunt vaak kiezen tussen een MQA en een normale cdversie (met het label HiFi). De MQAdecodering wordt gedaan door de desktopapp van Tidal en door speciale spelers met een ingebouwde MQAdecoder, bijvoorbeeld van Meridian. Individuele MQAbestanden, zoals bijvoorbeeld de 2l. nowebsite aanbiedt voor luistertests, kunnen ook met het programma Foobar 2000 (Windows) en Audirvana Plus (macOS) worden gedecodeerd en afgespeeld. Mobiel is bij Tidal de MQAdecodering alleen op Android te beluisteren, met iOS is tot nu toe alleen het ‘cddeel’ van de nummers beschikbaar.
In de technische beschrijvingen die tot nu toe beschikbaar zijn, bespreken de MQAontwikkelaars verschillende aspecten van de digitale opslag van muziek
waarover geluidsliefhebbers al decennia lang hartstochtelijk discussiëren [1]. Ook rond MQA ontstond een verhit debat [2]. De voorstanders zijn weg van het ‘superieure geluid’, terwijl critici MQA alleen zien als een verruist DRMsysteem dat nog erger klinkt dan cd. Omdat daarbij veel aspecten komen kijken die niet alleen van toepassing zijn op MQA, maar ook op andere hires formaten, lopen we de punten hier even af op hun relevantie voor het afspelen van muziek.
MEER DAN 44,1 KHZ?
Volgens de samplingstelling van Nyquist en Shannon is een samplefrequentie die tweemaal zo hoog is als de hoogste frequentie van het continue muzieksignaal voldoende om een audiosignaal nauwkeurig af te tasten. Voor een audiocd, die is gesampled op 44,1 kHz, kunnen daardoor audiosignalen tot 22,05 kHz gedigitaliseerd en wiskundig exact weer gereconstrueerd worden. Waarom dan bandbreedte verspillen aan hogere samplefrequenties die onnodig opslagruimte kosten?
Daar zijn drie redenen voor, maar slechts één daarvan is in de praktijk relevant. Allereerst gaat het om het frequentiespectrum boven de 22 kHz. Veel audiofielen zweren dat dit belangrijk is en de geluidskwaliteit beïnvloedt. Het menselijk gehoor kan echter alleen op jonge leeftijd frequenties tot 20 kHz waarnemen en naarmate de leeftijd toeneemt, daalt die limiet tot 15 kHz en lager. Alleen honden en vleermuizen horen de frequenties daarboven. Wat de dieren in dat gebied waarnemen, blijkt uit een test waarin de opname van een muziekstuk twee octaven lager wordt gezet, zodat het geluid tussen 22 en 88 kHz terechtkomt in het bereik van 5,5 tot 22 kHz. Het enige dat dan gewoonlijk overblijft is het scherpe geluid van crashbekkens en hihats, geen geluiden om de dieren meteen om te benijden.
Daar komt nog bij dat frequenties boven de 20 kHz geen rol spelen bij muziekproductie. Anders zouden bekende masteringtechnici als Bob Katz hun werk niet tot op hoge leeftijd kunnen doen. Katz, 69 jaar oud, hoort naar eigen zeggen nauwelijks nog iets boven 15 kHz, maar produceert elk jaar nog steeds uitstekend klinkende albums en legt in zijn standaardwerk ‘Mastering Audio’ zeer zorgvuldig de achtergrond uit van bitdieptes en samplerates [3]. Dus maak je geen zorgen, als je niets hoort boven 15 kHz. Muzikaal gezien mis je niets.
FILTEREN
Een tweede reden die wordt genoemd voor de hoge samplefrequenties zijn de noodzakelijke laagdoorlaatfilters. Die zijn nodig om alle frequenties boven de helft van de samplerate te verwijderen, anders zouden ze kunnen leiden tot storingen in het hoorbare bereik (aliasing). Bij het samplen op 44,1 kHz moeten dergelijke laagdoorlaatfilters op een relatief smalle frequentieband tussen 20 en 22 kHz de hoge frequenties relatief abrupt, oftewel steil, wegsnijden. Bij vroege cdspelers klonk dat niet goed omdat die filters onder de 20 kHz niet optimaal werkten.
Dat is momenteel bij de huidige digitaalnaaranaloogconverters (DAC) echter geen probleem meer. Zogeheten deltasigmaconverters werken op een veel hogere samplerate, en door die oversampling zijn minder steile filters nodig. Matthias Carstens, hoofdontwikkelaar van RME, zegt dat het tegenwoordig geen probleem meer is om digitale filters te gebruiken met een reductie van 90 dB tussen 20 en 22 kHz, terwijl de variaties in het lager liggende frequentiebereik slechts 0,005 dB zijn. Dat wordt bevestigd door onze eigen metingen. Zelfs goedkope audiointerfaces bieden tegenwoordig probleemloos een spiegelgladde, lineaire frequentierespons.
De benodigde laagdoorlaatfilters genereren echter ook een zogeheten ‘ringing’: een resonantie die korte pulsen van een soort gerinkel voorziet. Dat is vooral vervelend als de filters faselineair werken, omdat het rinkelen dan ook vóór de eigenlijke puls optreedt.
Filters kunnen inderdaad rinkelen en bij muzieksynthese wordt dat zelfs specifiek toegepast bij de geluidsproductie. Het rinkelen gebeurt echter altijd alleen bij de afsnijfrequentie en dan alleen als het filter op die frequentie geactiveerd wordt. Als het laagdoorlaatfilter bij 22 kHz begint, rinkelt het als het wordt gestimuleerd alleen daar, dus onhoorbaar voor mensen. Veel groter is de invloed van filters die bij equalizers worden gebruikt in elke muziekproductie. Daar kan een te steil filter inderdaad pulsen in het hoorbare bereik aantasten. Een laagdoorlaatfilter in de converter heeft dan geen invloed meer.
DITHERING
Het enige punt waar hogere samplefrequenties daadwerkelijk helpen, is bij de zogeheten dithering. Die simpel gezegd zachte ruis wordt steeds gebruikt als de bitdiepte van een digitaal audiobestand wordt verkleind. Aangezien dithering ook een centraal onderdeel is van MQA, gaan we er daar iets dieper op in.
Moderne productieprogramma’s werken intern meestal met een floatingpointaudioresolutie van 32of 64bit. Omdat een DAC alleen gehele getallen kan omzetten, moet de resolutie bij het afspelen op zijn minst tot 24 bit of zelfs tot 16 bit worden gereduceerd.
Als je de overbodige bits gewoon weglaat, ontstaat er door de afrondingsfouten echter vervorming. Met 16 bit zijn immers slechts maximaal 65.536 niveaus beschikbaar, voor een dynamisch bereik van ongeveer 96 dB. Als je een sinusgolf uitstuurt met bijvoorbeeld slechts 48 dB, worden de bits gehalveerd en valt het aantal mogelijke niveaus terug tot 256. Dat leidt tot de vorming van trapjes, die bij de conversie naar analoog naast de oorspronkelijke sinusgolf hoogfrequente verstoringen genereren. In de voorbeeldbestanden bij de link op de pagina hiernaast kun je dat zelf beluisteren.
Om dat te voorkomen, wordt bij dithering een speciale ruis toegevoegd. Dat signaal, dat bestaat uit willekeurig verdeelde ruisbits, wordt statistisch gelijkmatig over de werkelijke signaalwaarde gelegd. Als het signaalniveau precies halverwege tussen twee bits ligt, schakelt de ene helft van het geluid de bovenliggende bit in en de andere helft schakelt hem uit. Maar als het echte niveau 25 procent is, dan is de verhouding tussen aanenuitbits 1:3, enzovoort. Op basis van de verdeling van de ruisbits kan het niveau van het reële signaal veel nauwkeuriger worden gereconstrueerd tijdens de analoge conversie. Bij de 16bit van een cd is het mogelijk om met behulp van dithering laagfrequente signalen met meer dan 120 dB op te slaan, waarbij trapjes en vervorming vermeden worden.
De prijs die je daarvoor betaalt, is echter een iets hoger ruisniveau. Voor een cd ligt het niveau van een dergelijk ditheringtapijt bij 16 bit tussen 75 en 90 LUFS (Loudness Units Full Scale). Bij een opname met 24 bit kan dat 48 dB lager liggen. Om ervoor te zorgen dat het zachte ruisen niet stoort, worden zoveel mogelijk frequentiecomponenten door noiseshaping naar het hoge frequentiebereik verschoven, daar waar het menselijk gehoor minder gevoelig is.
Met een samplefrequentie van 44,1 kHz kan de ditheringruis slechts worden verschoven naar 22,05 kHz. Het verdubbelen van de samplefrequentie stelt echter plotseling een groot gebied boven het hoorbare spectrum beschikbaar voor noiseshaping. Bij wat’ experimenteren met de POWr2dithering die bij veel Digital Audio Workstations (DAW) wordt gebruikt, vonden we dan ook duidelijke verschillen bij het samplen van een bestand met 16 bit op 44,1 kHz en op 96 kHz. Met toenemende samplefrequentie stopt POWr 2 steeds meer ruisenergie in de hoge frequenties voorbij het hoorbare gebied en laat tegelijkertijd de ruisvloer in de lagere frequenties zakken.
Omdat dithering daarbij zowel de eerder genoemde hoogfrequente storingen voorkomt als de resolutie van extreem zachte signalen verbetert, moet er bij het downsamplen naar 24 of 16bit steeds geditherd worden. Dithering mag echter maar één keer worden uitgevoerd en als laatste bewerkingsstap voordat de bitdiepte wordt verminderd. Als je een al geditherd bestand nog verder digitaal bewerkt, verstoor je onvermijdelijk de statistisch gebalanceerde verdeling van de ruisbits en daarmee de gewonnen resolutie. Daarom werkt dithering ook niet voor een daaropvolgende codering in MP3, AAC en Ogg Vorbis.
DE OPKOMST VAN MQA
De ontwikkelaars van ‘Master Quality Authenticated’ (MQA) kregen een bijzonder idee. Ze creëerden ook ruis voor dithering, maar verborgen daar nog meer
informatie in. Daartoe behoren een digitale handtekening, die op unieke wijze het bestand identificeert, evenals akoestische informatie uit het frequentiebereik boven 22 kHz, die mogelijk aanwezig kan zijn in wavebestanden met 96 kHz of 192 kHz.
Als je een MQAbestand afspeelt zonder een geschikte decoder, klinkt dat als een normale cdopname met dithering. De vorm van de ruis werd zo aangepast met noiseshaping dat die pas sterker wordt boven 13 kHz, waar de gevoeligheid van het menselijk gehoor aanzienlijk afneemt. Het volume van de MQAruis werd uitgelijnd met de dithering van een 16bit cd en is bij een 24bit MQAbestand net zo luid als bij een 16bit MQAbestand – tenminste, zolang de informatie in de MQAruis niet gedecodeerd wordt.
Om dat te verifiëren, hebben we de ontwikkelaars vam MQA een 32bit wavebestand met een zacht testsignaal gestuurd, met de vraag om dat om te zetten naar een 16bit/44,1kHz MQAbestand en een 24bit/48kHz MQAbestand, zoals Tidal ze streamt in de FLACcontainer.
De MQAencoder is tot nu toe nog niet vrijgegeven. Sommige masteringstudio’s krijgen alleen online toegang, waarmee ze hun bestanden kunnen laten coderen op een MQAserver. Een plugin voor DAW’s staat op de planning, maar de producent heeft geen datum genoemd.
De met MQA gecodeerde bestanden vertoonden de verwachte resultaten. Zonder een decoder ruisten de 16bit en 24bit bestanden net zo luid als een geditherde 16bit CD. Na decodering was bij het 16bit bestand geen ingrijpende verandering van het ruistapijt te ontdekken. MQA gebruikt de daar in de dithering verborgen informatie duidelijk alleen voor de handtekening voor authenticatie. Bij het 24bit MQAbestand daalde het niveau van de ditheringruis na decodering tot ongeveer het niveau van een conventioneel geditherd 24bit wavebestand. Vergeleken met een ongecodeerd 48kHzbestand konden we geen verbetering zien bij het MQAbestand met 96 kHz (zie pagina 79).
WAT LEVERT HET OP?
MQA kan de ditheringruis van een 24bit bestand niet verbeteren. Er blijft dus alleen het vermeende geluidsvoordeel dat MQAbestanden audiosignalen boven de 22 kHz opslaan. Om dat te testen, controleerden we het frequentiespectrum van een tiental MQAalbums op Tidal. Slechts ongeveer de helft van de steekproef (onder andere Bob Marley’s ‘Kaya’, 3D Katalog van Kraftwerk, ‘Rhythm and Repose’ van Glen Hansard) vulde het frequentiebereik tot 48 kHz inderdaad met audioinformatie. Bij de andere helft (waaronder Adams ‘The Love Album’, ‘Colors’ van Beck en ‘Desperate Man’ van Eric Church ) waren in de spectraalanalyse van Music Scope frequentiegaten of stoorstrepen te zien. Als het gebrek aan een frequentieband in het ultrasone bereik niet belangrijk was voor de masteringtechnici, dan maakt het blijkbaar niet uit voor het geluid.
Toch merkten we geluidsverschillen op tussen de HiFi en de MQAversie van een Tidalstream. De gedecodeerde MQAbestanden werken met een diepte van 24 bit en hebben daarom minder ruis dan de 16bit HiFibestanden. Hetzelfde kan echter worden bereikt met een puur 24bit FLACbestand zonder MQA. Bovendien zijn sommige MQAversies anders afgemixt. Soms waren ze 2 dB luider dan de HiFiversies (zoals Beck ‘Colors’ en Red Hot Chili Peppers ‘Californication’), soms 3 dB zachter met meer dynamiek (Glen Hansard ‘Rhythm and Repose’). De oorzaken liggen bij de master, niet bij het MQAprocedé.
GESIGNEERDE DITHERING
Is MQA dus akoestische kwakzalverij? Een directe geluidswinst ten opzichte van een normaal wave of FLACbestand met 24bit/48kHz is volgens ons onderzoek niet te behalen. Hogere samplerates van 96 kHz zijn alleen nuttig voor muziekbestanden die in de productie als afzonderlijke tracks moeten worden gemixt tot een arrangement. Daarbij kunnen de ruistapijten elkaar immers versterken. Op Tidal klinken MQAalbums beter omdat ze minder ruisen dan de 16bit hifiversies, dankzij de 24bit woordbreedte. Maar dat zou ook mogelijk zijn met normale FLACstreams met 24bit/48kHz.
MQA is vergeleken met de cd geen codec met verlies, zoals sommige critici zeggen. Door ervoor te zorgen dat een MQAbestand dithering bevat en niet achteraf kan worden gewijzigd, kan dat in de praktijk fouten in de distributieketen voorkomen. Want af en toe vergeten muziekproducenten dithering of andere digitale bewerkingen uit te voeren, zoals het aanpassen van het volume van een album. Dat vernietigt de belangrijke distributie van ruisbits en maakt het positieve effect van dithering ongedaan.
Dergelijke fouten kunnen bij MQA niet voorkomen. Bovendien hoeven muziekproducenten zich geen zorgen te maken over verschillende streamingformaten en volumeaanpassingen. Die zijn tot nu toe namelijk niet mogelijk bij MQA. ‘We werken aan een oplossing’, aldus de producent. Wat er overblijft van de aangekondigde ‘geluidsrevolutie’ van MQA is uiteindelijk een dithering met een digitale handtekening. Niets meer, maar ook niets minder.