To otwiera możliwość rozwoju serwisów streamingowych oferujących jakość powyżej standardu CD, stwarza także szansę upowszechnienia mobilnego strumieniowania muzyki nawet w formatach studyjnych. Rozwiązanie przedstawione podczas warszawskiej premiery zorganizowanej przez firmę 3Logic jest bardzo obiecujące, a zainteresowanie wielu poważnych firm może już pod koniec roku zaowocować serwisem strumieniowym przesyłającym pliki 24-bitowe. Trzymamy kciuki za powodzenie tego przedsięwzięcia, a poniżej – dzięki uprzejmości firmy 3Logic – prezentujemy artykuł Johna Atkinsona ze Stereophile’a, który – pozostając pod wielkim wrażeniem patentu Meridiana, podobnie jak my – przedstawia szczegóły tego rozwiązania.
John Atkinson – Stereophile.com
Słyszałem przyszłość streamingu: Meridian MQA
Przez prawie 40 lat uczestniczę w konferencjach prasowych i tylko kilkakrotnie miałem poczucie, że uczestniczę w narodzinach nowego świata. W marcu 1979 roku byłem w Philips Research Center w Eindhoven, gdzie słyszałem prototyp tego, co później nazwano dyskiem kompaktowym (CD). Latem 1982 roku odwiedziłem Rona Genereux i Boba Berkowitza w Acoustic Research pod Bostonem i usłyszałem bardzo wczesne cyfrowe przetwarzanie sygnału DSP, które pozwalało na korekcję akustycznych problemów powodowanych przez pomieszczenia. Zaś w grudniu 2014 roku w nowojorskim biurze Meridian, widziałem jak Bob Stuart opisuje technologię MQA, po czym nastąpiła prezentacja, która zwaliła mnie z nóg.
Korzystając z pary aktywnych głośników cyfrowych Meridian, podłączonych do laptopa Bob odtwarzał 24-bitowe pliki z częstotliwością próbkowania do 192kHz, przy czym dane były przesyłane z prędkością niewiele większą niż 1,5Mbps CD. A do tego wyrazistość dźwięku, przejrzystość oryginału, której niemal nigdy nie słyszałem.
Dzięki tak niskiemu przesyłowi danych MQA pozwala dostarczyć audio w wysokiej rozdzielczości przy pomocy tych samych kanałów, z których obecnie miłośnicy muzyki korzystają, doświadczając najwyższej jakości CD, jak Tidal lub Qobuz.
Jak to zatem możliwe?
MQA
MQA to efekt lat badań Boba Stuarta i jego współpracowników, oraz uznanego angielskiego inżyniera Petera Cravena. Badania zwrócono w kierunku podstaw i sprawdzenia jak odbierany jest dźwięk oraz jaka jest fundamentalna natura muzyki. Bob podzielił się ze mną swoją prezentacją i publikuję jej niektóre slajdy, aby opisać, co MQA robi. To, co znajdziecie poniżej to moja interpretacja prezentacji Boba, jeśli są tam błędy, są to moje błędy.
Rysunek 1. – Spektrum kwartetu smyczkowego Ravela, próbkowanego z częstotliwością 192kHz przy 24-bitowym PCM. Na takim diagramie transmisji danych wyrażona jest powierzchnią.
Rysunek 1 to wariacja, tego, co nazywa się “Diagramem Shannona”; pokazuje przestrzeń informacyjną sygnału audio – oś pionowa w dB, częstotliwość na osi poziomej w kHz. Szczytowe poziomy nagrania kwartetu smyczkowego przedstawione są jako czerwona linia, niebieska linia to poziom zakłóceń w tle. (Bob mówił, że niezależnie od typu muzyki charakterystyczny jest trójkątny kształt przestrzeni informacyjnej, co wynika z tego, że zarówno muzyka jak i instrumenty muzyczne ewoluowały tak, żeby dopasować się do wrażliwości naszego słuchu. Szary obszar po lewej stronie, powyżej zielonej linii pokazuje, ile informacji jest zachowanych przy nagraniu 16bit/48kHz PCM. Poniżej zielonej linii pokazane jest o ile więcej informacji jest zachowanych przy 24bitach. Kiedy częstotliwość próbkowania zwiększona jest do 96kHz, zachowane informacje pokazuje obszar różowy, ponowne podwojenie pozwala na zachowanie pełnej przestrzeni informacyjnej.
Patrząc uważnie na czerwoną i niebieską linie, cztery rzeczy stają się jasne:
1) do rozkodowania wszystkich informacji muzycznych nagrania konieczna jest częstotliwość próbkowania powyżej 96kHz
2) informacja powyżej 55kHz to szum
3) w bazowym paśmie powyżej 24khz poziom szumu jest powyżej 16-bitowej kwantyzacji
4) informacja muzyczna zajmuje jedynie część przestrzeni informacyjnej, ogólnie rzecz biorąc będzie to trójkątny obszar z największym zakresem dynamiki w niskich częstotliwościach i najniższą dynamiką na najwyższych częstotliwościach. Jest tak, ze względu na samą naturę muzyki związaną z jej spektrum.
Ostatni punkt wiąże się z obserwowalnym faktem, że za każdym razem, gdy częstotliwość próbkowania PCM zostaje podwojona, może nastąpić niewielka poprawa w jakości dźwięku, zaś przesył danych i wymagana przestrzeń dyskowa pliku również ulegają podwojeniu. Dźwięk stereo 16/48k wymaga przesyłu danych 1,54Mbps, 24/96k – 4,6Mbps; 24/192k 9,2Mbps. Linearna PCM traktuje wszystkie współrzędne przestrzeni informacyjnej jako równie ważne. Stąd nieefektywność w uchwyceniu i transmitowaniu informacji muzycznych w formie PCM.
Bob Stuart przedstawił następnie koncepcję „Origami audio”: składania komponentów ultradźwiękowych muzyki w pasmo bazowe, dzięki czemu przepustowość danych może zostać zmniejszona.
Rysunek 2. MQA korzysta ze statystyk informacji muzycznych, żeby zakodować dane oktawy 4Fs w niewielkim obszarze poniżej częstotliwości Nyquista 4Fs.
Pierwszy krok widać powyżej. Informacja muzyczna powyżej 48kHz ma bardzo niską dynamikę, więc pomimo wymaganej częstotliwości próbkowania 192kHz, obszar, który zajmuje w przestrzeni informacyjnej diagramu („C”) jest mała. MQA ujmuje te informacje w mniejszym trójkątnym obszarze w okolicach -130dB i pomiędzy 24 a 48kHz, obszarze, który we wszystkich rzeczywistych nagraniach, byłby losowymi liczbami, czyli szumem. Rezultatem jest plik o próbkowaniu 96kHz, który zawiera w sobie informacje muzyczne próbowane przy 192kHz.
Rysunek 3. Taki sam proces kapsułkowania może być przeprowadzony przy danych oktawy 2Fs Ale nie ma powodu, żeby w tym miejscu się zatrzymać. Rysunek trzeci pokazuje, jak MQA zawiera informacje muzyczne pomiędzy 24 i 48kHz próbkowane przy 96kHz („B”) w bazowym paśmie przestrzeni informacyjnej „A”. Zakres dynamiczny informacji muzycznej w tej okrawie jest większy niż ten powyżej 48kHz, kapsułkowanie wykorzystuje bezstratne kodowanie, w czego efekcie niewielki prostokątny obszar może być ukryty poniżej szumów nagrania w zakresie bazowym poniżej 24kHz. Rysunek 4. 24 bitowy plik MQA próbkowany 48kHza zawiera wszystkie informacji, konieczne do odtworzenia muzyki próbkowanej 192kHz.
Rysunek 4 pokazuje ostateczny rezultat tego składania „orgiami”: 24 bitowy plik MQA próbkowany z 48kHz zawiera te same informacje muzyczne, które odpowiadają oryginalnemu nagraniu próbkowanemu 192kHz. Nie dostajemy czegoś za nic: dane powyżej bazowego zakresu F są upakowane wydajnie poniżej poziomu szumu nagrania, wykorzystując ujemne wahania, w przestrzeni informacyjnej, której część w innym wypadku byłaby losowa, i niesłyszalna. Kiedy plik jest odtwarzany z dekoderem MQA, „rozkłada się” tak, aby oddać oryginalną rozdzielczość i przepustowość pasma wymaganą do odtwarzania muzyki bezstratnie.
Bezstratna kompresja pliku daje dalszą redukcję w transferze danych, do jak rozumiem około 1,5Mbps na kanał dla nagrania stereo, tylko niewiele więcej niż wymagane jest dla nieskompresowanego audio CD i dwa razy więcej niż wymagane jest dla transmisji 16/44.1k FLAC lub ALAC.
Zalety dla streamingu są oczywiste. Bez zwiększania przepustowości, serwisy streamingowe mogą oferować prawdziwe audio o wysokiej rozdzielczości. W momencie, gdy piszę te słowa brytyjski serwis 7digital ogłosił światowe, strategiczne partnerstwo z Meridian Audio, „adaptuje MQA aby stać się dostawcą pierwszej cyfrowej platformy muzycznej oferującej wysokiej jakości format audio zarówno do pobrania jak i streamingu”.
Ponieważ dekoder MQA to oprogramowanie, a nowoczesne DAC-i pracują w oparciu o firmware, nie ma przeszkód dla firm produkujących urządzenia, w oferowaniu dekodowania MQA innych niż uzyskanie licencji na tę technologię. Pierwszy dekoder MQA jest już dostępy – jest to wersja druga urządzenia Meridian Explorer, która będzie mogła odtwarzać MQA.
Ale…. przecież już mamy dostęp do wysoko próbkowanego audio przez takie strony jak HDtracks.
Poza krótszym czasem ściągania jakie są zalety MQA?
Są dwie, jedna komercyjna, druga dotycząca jakości dźwięku: Kompatybilność wsteczna.
Patrząc ponownie na rysunek 4 można zobaczyć, że zielona linia definiuje 16 bitowy poziom szumu dla 16bitowego formatu PCM. Wszystkie kapsułkowane informacje zawierają się w tym limicie. Więc jeśli plik jest okrojony do 16bitów, jest odpowiednikiem normalnego bazowego zakresu cyfrowego nagrania, próbkowanego w 48kHz. DAC, który nie ma dekodera MQA będzie odtwarzał plik MQA jak normalny 16 bitowy plik.
Oznacza to, że firmy nagraniowe nie musza oferować wielu formatów plików. Jeden będzie odpowiedni zarówno dla ogółu jak i audiofilów. Craig Kallman, prezes Atlantic, który był na evencie na Manhattanie, wyraził bardzo duży entuzjazm odnośnie tej cechy MQA.
Rysuje się tu analogia z long playami: jeden nośnik, który może być odtwarzany na odtwarzaczach rynku masowego, ale gwarantuje większą jakość dla tych, którzy zainwestują w lepsze urządzenia. I MQA zamierza zagwarantować sprawdzone nagrania masters w wysokiej rozdzielczości – żadnych więcej upsamplowanych nagrań studyjnych CD prezentowanych jako „wysoka rozdzielczość”.
Korekta źródła
Powróćmy do trójkąta informacji muzycznej na rysunku 1, powraca stare pytanie, po co mamy zachowywać i odtwarzać częstotliwości przekraczające możliwości ludzkiego słuchu, nawet jeśli możemy to robić? Bob spędził nieco czasu dyskutując na ten temat w trakcie prezentacji i doszedł do wniosku, że para ucho-mózg nie działa jak analizator częstotliwości. Ewolucja nastroiła ten system tak, że jest w stanie wykrywać czasowe różnice, które są odpowiednikiem pasma wyższego niż 20kHz i że filtry antyaliasingu w konwerterach A/D i filtry rekonstrukcyjne w D/A wprowadzają czasowe smugi, które są znacznie większe niż to, do czego nasze ucho i mózg oczekują od naturalnego dźwięku: te smugi, są , w moim odczuciu, odpowiedzialne za tzw. „cyfrowy” dźwięk.
Kodowanie i dekodowanie MQA zostały zaprojektowane tak, żeby przejścia dokonywały się w takiej samej formie i w taki sam sposób, jak czasowa wrażliwość ucha i mózgu. I jeśli już przy etapie dekodowania, efekt czasowy konwertera A/D może być skompensowany, system oferuje pełen wgląd na pierwotne muzyczne wydarzenie. Meridian opisuje to jako „przeniesienie oryginalnego nagrania master jeszcze dalej, w kierunku oryginalnego wystąpienia, w analogiczny sposób w jaki eksperci dokonują renowacji obrazów usuwając brud i nadają żywiołowość pracom starych mistrzów.
Sądząc po nagraniach, które słyszałem na Manhattanie, z których niektóre zostały nagrane we wczesnych latach 50., poczułem, że wprowadzenie MQA jest tak ważne dla jakości dźwięku nagrania i odtwarzania, tak jak digitalizacja była 40 lat temu.