Jak komputer widzi dźwięki – czyli reprezentacja dźwięku w komputerze – Czym jest dźwięk?



Jak komputer widzi dźwięki – czyli reprezentacja dźwięku w komputerze – Czym jest dźwięk?

0 0


dzwiek-prez

Presentation about representing sounds in a computer (in Polish).

On Github lewapkon / dzwiek-prez

Jak komputer widzi dźwięki

czyli reprezentacja dźwięku w komputerze

Autor: Paweł Koniarski

Czym jest dźwięk?

Fala akustyczna o płynnie zmieniającej się amplitudzie, trudna do opisania wzorem matematycznym.

Dlatego aby umożliwić przechowywanie dźwięków na komputerze dokonuje się ich digitalizacji.

Dźwięk jest falą akustyczną, której amplituda zmienia się płynnie w czasie. W każdym momencie wielkość amplitudy może być inna. Opisanie takiej fali wzorem matematycznym byłoby trudne, dlatego, aby dźwięki mogły być przechowywane na komputerze, dokonuje się ich digitalizacji.

Digitalizacja

Zamiana na postać cyfrową.

Próbkowanie (ang. sampling) – pomiar wartości amplitudy dźwięku w równych odstępach czasu i zapisanie tych wartości w postaci liczbowej.

Próbka (ang. sample) – zapis dźwięku powstały przy użyciu próbkowania.

Digitalizacja to zamiana czegoś na podstać cyfrową. W przypadku dźwięków mierzy się wartości amplitudy w równych odstępach czasu i zapisuje się je w postaci liczbowej. Taki proces nazywany jest próbkowaniem. Uzyskany w ten sposób zapis dźwięku nazywa się próbką.

Próbka

Jakość próbki zależy od:

  • częstotliwości próbkowania (ang. sampling rate),
  • dokładności zapisu liczbowego próbki (ang. audio bit depth).
Jakość próbki zależy od dwóch czynników: częstotliwości próbkowania oraz dokładności zapisu liczbowego próbki. Częstotliwość próbkowania oznacza ile razy na sekundę został dokonany pomiar amplitudy. Natomiast druga z wymienionych przeze mnie cech próbki oznacza ile jest możliwych wartości amplitudy dźwięku. Oczywiście jakość dźwięku wzrasta wraz ze wzrostem obu tych wielkości. Tym samym wzrasta rozmiar otrzymywanych plików.

Formaty zapisu dźwięku

Wave

Często wykorzystywany format do zapisu dźwięku nieskompresowanego.

Najczęściej używany do zapisu na płytach CD:

  • częstotliwość próbkowania: 44,1kHz,
  • każda wartość zapisana na 16 bitach.
Format wave jest zazwyczaj używany do zapisu dźwięków nieskompresowanych. Jedna z jego wersji jest bardzo często używana do zapisywania płyt muzycznych CD. Na takiej płycie zwykle mamy pliki z częstotliwością próbkowania równą 44100Hz oraz każda wartość zapisywana jest na szesnastu bitach, czyli mamy 65536 możliwych wartości.

Ile zajmuje takie nieskompresowane nagranie

Rozmiar pliku zawierającego minutę nagrania w formacie jak na płycie CD:

60s⋅44100próbeks⋅16bpróbkę8bB⋅106BMB60s⋅44100próbeks⋅16bpróbkę8bB⋅106BMB⋅2⋅2 =10.584MB =10.584MB

FLAC

  • kompresja bezstratna (podobna do zip/rar),
  • strumieniowość,
  • małe wymagania sprzętowe,
  • odporność na błędy,
  • metadane.

Inne formaty kompresji bezstratnej:

  • OGG (FLAC),
  • AIFF,
  • APE.
odporność na błędy – podział pliku na ramki ogranicza błąd strumienia do poszczególnej ramki

MP3

Kompresja stratna bazująca na wadach ludzkiego ucha. Matematyczny opis tychże cech nazywa się modelem psychoakustycznym.

Pozwala na nawet dziesięciokrotne zmniejszenie objętości pliku bez utraty słyszalnej jakości.

Inne formaty kompresji stratnej:

  • WMA,
  • OGG (Vorbis),
  • AAC (M4A).
Człowiek słyszy od ok. 20Hz do 20kHz, przy czym dobrze słyszy do 5kHz. W przypadku gdy nakładają się na siebie dwa dźwięki o podobnej częstotliwości, słyszymy tylko głośniejszy z nich.

MIDI

Komputerowy odpowiednik partytury.

Sekwencer – specjalny program umożliwiający komponowanie muzyki w postaci nutowej.

Umożliwia wymianę danych z elektronicznymi instrumentami muzycznymi (np. keyboardami).

Ma bardzo małą objętość, lecz dźwięk jest ograniczony do ustalonego z góry zbioru instrumentów

Przykład muzyki stworzonej w formacie MIDI:

wymiana danych – pozwala na zapisywanie w pamięci komputera granej na instrumencie muzyki, w celu jej późniejszej edycjiobjętość rzędu kilkunastu lub kilkudziesięciu kB, gdyż określa tylko wysokość każdego dźwięku i jego czas trwaniadźwięk ograniczony do ustalonego z góry zestawu instrumentów (nie można w ten sposób zapisać np. głosu ludzkiego)

Dziękuję za uwagę

prev next