Fizykon.org - strona główna   | O witrynie |O autorze witryny | kontakt z autorem |

 

Próbkowanie i jego ograniczenia

Cyfrowy zapis dźwięku, mimo powszechnego przekonania o jego doskonałości, doskonałym nie jest. A właściwie, to precyzyjniej się wyrażając, należało by powiedzieć, że jego doskonałość jest limitowana, parametrami zapisu. 
Dlaczego? - o tym będzie w tym rozdziale, bo postaram się naświetlić rzecz teoretycznie, i jednocześnie pokazać, że mimo wszystko jest jeszcze co nieco do poprawienia.

Próbkowanie dźwięku

Cyfrowy zapis dźwięku opiera się na procedurze zwanej próbkowaniem. Próbkowanie, to nic innego, tylko odczytywanie poziomu sygnału akustycznego w danej chwili i zapisywanie jako liczby.

Oczywiście, prawie zawsze liczba ta jest zapisywana w formacie dwójkowym.

Ponieważ sygnał akustyczny robi w trakcie swojego życia różne "wygibasy", więc zapis jest tym lepszy, im dokładniej (częściej, więcej razy na sekundę) zostanie spróbkowany. W przypadku płyty CD próbkowanie odbywa się 44100 razy na sekundę. Dlatego częstotliwość próbkowania wynosi tu 44,1 kHz.

Jeżeli przyjrzymy się jakby pod "mikroskopem" operacji próbkowania, to okaże się, że dla bardzo szybkozmiennych sygnałów zapis nie jest już zbyt dokładny.

Jak to widać na wykresie, zapisana krzywa nie jest właściwie gładka, tylko kanciasta. Na szczęście większość odtwarzaczy "zaokrągla" te dźwięki przed ich odtworzeniem. Jednak...

... gdy próbkowanie jest bardzo rzadkie, to może się okazać, że zapisany cyfrowo sygnał (linia brązowa) jest całkowicie inny od sygnału źródłowego (linia niebieska). Na rysunku powyżej widać, że zapisano pojedynczą "górkę", a źródłowy sygnał, obejmował zarówno dodatnie, jak i ujemne obszary wykresu.

Dlatego zasadą jest, że im gęściej zapisywany jest sygnał (czyli im większa jest częstotliwość próbkowania), tym dokładniej opisze on brzmienie muzyki. W teorii przyjmuje się, że najwyższa zapisywana częstotliwość jest równa połowie częstotliwości próbkowania (tzw. kryterium Nyquist-a). Można to prześledzić na przykładzie sygnału o kształcie sinusa - widać, że można to w miarę dobrze zrobić zrobić zapisując jego skrajne wychylenia. Otrzymamy kanciasty (piłokształtny) sygnał, który z grubsza przypomina zapisywanego sinusa.

Jednak, jeżeli punkty próbkowania wypadną w miejscach przecięcia z osią X-ów?

- wtedy zapewne sygnał nam zniknie!

Jeśli zaś punkty rozłożą się jeszcze inaczej, to otrzymamy jakiś taki mocno "pokiereszowany" przebieg.

W szczególności na rysunku niżej widać, że z samego faktu próbkowania sinusa "pojawiły się" jakby dwa przebiegi w sygnale - jeden o małej, drugi o większej amplitudzie "wmiksowane" w siebie.

 

Jakiego dźwięku dopatrzy się ucho z sygnału (niebieskiego) spróbkowanego jak poniżej? Czy elektronika odtwarzacza w ogóle "zorientuje się" że to był sinus? - bo rozkład zapisanych liczb mógł równie dobrze odpowiadać innemu sygnałowi (prawdziwe dźwięki bardzo rzadko są dokładnym sinusem, więc prawie wszystkie możliwości są tu dozwolone).

Człowiek słyszy sygnały akustyczne o częstotliwościach dochodzących w porywach do 20 KHz, więc teoretycznie zapis z próbkowaniem do 44,1 kHz, mogący zapisywać dźwięki do 22 kHz powinien wystarczyć (jest nawet 2 kHz zapasu). Jednak jaki to jest zapis tych wyższych częstotliwości! - nie zapisuje się kształt sygnału, a jedynie jego wystąpienie (w sprzyjających warunkach próbkowania), poza tym dochodzi do niekorzystnego zjawiska aliassingu - czyli generowania przez sam sposób zapisu nowych, nieistniejących w oryginale dźwięków (przykład - patrz wykres na początku tej części artykułu - co prawda sinus zapisywany przy tej częstotliwości próbkowania będzie niesłyszalny, ale jego nieadekwatne zniekształcenie spowodowane zapisem - już tak!). Efekt powyższy może spowodować, że po zapisaniu sinusoidalnego dźwięku np. 18 kHz, usłyszymy w głośniku dźwięk zależny od różnicy tych 18 KHz i połowy częstotliwości próbkowania 22 kHz. Tak 4 hercowy dźwięk będzie o wiele lepiej słyszalny niż źródłowy 18 kilohercowy.

Ostatecznie, mamy taką sytuację, że tylko z racji zapisywania dźwięku przy odtwarzaniu powstaje wiele nieprzyjemnych zniekształceń:
pojawiają się tony, których w sygnale źródłowym w ogóle nie było (zjawisko aliassingu)
znikają tony, które były
powstają tzw. szumy próbkowania.

Część z tych efektów da się co prawda złagodzić - np. poprzez ograniczenie zapisywanego pasma częstotliwości, czy wyrafinowane metody antyaliassingowe stosowane podczas zapisu. Poza tym układy scalone stosowane w odtwarzaczach CD wyraźnie poprawiają efekt końcowy eliminując niektóre powstające szumy i typowe zniekształcenia. Jednak oczywiście nie wszystkie, zaś wprowadzane techniki mają negatywne skutki uboczne, co objawia się zubażaniem odtwarzanej muzyki. Przecież żaden układ elektroniczny nie "wie" jak naprawdę powinna wyglądać muzyka zapisana w zubożony przez ograniczone próbkowanie sposób i tylko "domyśla" się jej na podstawie niepełnych danych.

Wszystko to razem powoduje, że wytrawny audiofil, doszukujący się w dźwięku szczegółów i niuansów zauważy wyraźną różnicę między dźwiękiem klasy CD, a muzyką zapisywaną za pomocą nowych formatów zapisu (oczywiście nie na standardowej wieży stereo z promocji w supermarkecie, bo wymagane jest posiadanie nie tylko odtwarzacza nowej generacji, ale także naprawdę dobrego wzmacniacza i kolumn). Toteż większość wyrobionych słuchaczy odczuwa przesiadkę z powrotem na standard CD jako wyraźne spłycenie odbioru muzyki.

O formatach audiofilskich