MP3 formátum; multimédia szakértő

Bevezetés

alapuló kódolók

Figyelembe véve a jó minőségű analóg jel (az emberi fül számára) helyreállításának elméleti korlátozásait egy mintavételezett jelből (Shannon-tétel), az audio CD-kre olyan hangtároló formátumot írtunk elő, amelynek az alábbi adatai voltak:
Mintavételi frekvencia = 44,1 kHz
16 bites kódolt adatok
Sztereó hang


Ez azt jelenti, hogy a digitalizálandó zeneműből vett mintákat 44,1 kHz-es sebességgel veszik, hogy 16 bitre (azaz 65 536 különböző lehetséges szintre) vannak kódolva, és hogy a hang sztereó, azaz egy adott mintához, a jobb és a bal csatorna tárolásának szükségessége.
Ennél a szabványnál mennyi helyet foglal egy perc zene? ?
1 másodperc alatt 44,100 mintánk van (44,1 kHz). Minden minta 16 bitre vagy 2 bájtra van kódolva, és a hang sztereó. Ezért ((44100 * 2) * 2 * 60) bájtunk van egy perc sztereó zenéhez, azaz 10,584x10 6 bájt !

Körülbelül 10 MB szükséges egy perc zene tárolásához.
Látjuk, hogy a digitális adathordozón tárolt audiojel sok helyet foglal el, ezért a tömörítés megkísérlésének gondolata és az MP3 szabvány megjelenése.

MP3 tömörítés

Mi az MP3 tömörítési technika ?
Valójában inkább a végeredmény eléréséhez használt technikák sorozatáról kell beszélnünk. E technikák közül egyeseket rombolónak mondanak, mások nem.

Romboló tömörítés, ez egy tömörítés, amelyet információ elvesztésével hajtanak végre. Ez azt jelenti, hogy ha egy ilyen technikával kibontjuk a tömörített jelet, akkor nem találjuk meg az eredeti jelet.

A pusztító tömörítési technikák között, lényegében vannak olyan módszereink, amelyek kihasználják az emberi fül tulajdonságait. Ez utóbbi a 20Hz és 20kHz közötti frekvenciákat hallja. Ha egy dal ezen a tartományon kívüli frekvenciákat tartalmaz, tisztán és egyszerűen törölhetjük őket anélkül, hogy a hangminőség romlana, mivel a fül nem hallja őket. Valójában helyesen halljuk a 2kHz és 5kHz közötti frekvenciákat. Valójában kevesebb, mint 5dB kell ennek a sávnak a frekvenciáinak meghallgatásához, míg 20dB-nél több kell a 100Hz alatti vagy 10kHZ feletti frekvenciák meghallgatásához. Ezek az eredmények felhasználhatók a fájlméretek csökkentésére. Például eldönthetjük, hogy minden 15 kHz feletti frekvencia törlődik.


Az MP3 a a frekvenciák elve álarcos. Ha egy frekvenciacsoportban egyesek sokkal magasabb hangszinttel rendelkeznek, mint mások, akkor nem szükséges megtartani az alacsony zajszintet: nem fogják hallani őket. Meggyőzőbb összehasonlítás érdekében képzelje el, hogy a kertjében tartózkodik, és hallja a madarak csicsergését. Az egyetértés áthalad a fejed felett (méghozzá nagyon magasan). A madarakat már nem hallja, mert az általuk keltett hang sokkal alacsonyabb, mint a repülőgép által generált hang. Mintha a madarak már nem léteznének, vagy abbahagyták volna az éneklést. Láthatjuk, hogy nem szükséges az összes frekvenciát kódolni egy darabban, hogy az emberi fül úgyis helyesen érzékelje. Végül, ha a sztereó hang két csatornája hasonló szekvenciákat mutat be, akkor ahelyett, hogy ezeket a szekvenciákat megkettőznénk, nyilván tárolunk egyet és információt, hogy ebben az időben a jobb és a bal csatorna azonos.