Audiokompression

Audiokompression eigentlich Audioreduktion ist im Normalfall eine Datenreduktion "verlustbehafteter" Algorithmus und nur sehr selten eine echte eine Datenkompression "verlustfreier" Algorithmus. Sie ist darauf abgestimmt, digital gespeicherte Audio-Dateien effektiv in ihrer Größe zu reduzieren. Wie bei anderen spezialisierten Arten der Datenkomprimierung (v. a.: Video- und Bildkompression) gibt es verschiedene Möglichkeiten, um den Verkleinerungseffekt zu erzielen.

Inhaltsverzeichnis

Verlustfreie Kompression

Verglichen mit Bildkomprimierung werden verlustfreie Komprimierungsmethoden in der Audiokomprimierung nicht so häufig verwendet. Die Hauptbenutzer von verlustfreier Komprimierung sind Toningenieure und ihre Kunden, die den Qualitätsverlust der verlustbehafteten Kompressionsmethoden vermeiden wollen.

Der Grund für die geringe Verwendung ist die geringe Kompression, die hierbei erreicht werden kann.

Die große Mehrzahl der Tonaufnahmen sind natürliche Töne, aufgenommen aus der realen Welt; solche Daten können nicht gut komprimiert werden. Man kann das mit Photos vergleichen, die sich nicht so gut komprimieren lassen wie computergenerierte Bilder. Aber auch computergenerierte Tonabfolgen können sehr komplizerte Wellenformen enthalten, die sich mit vielen Kompressionsalogrithmen nur schlecht verkleinern lassen. Dies liegt an der Natur der Schallwellen, die sich im Allgemeinen schwer vereinfachen lassen ohne eine zwangsweise verlustbehaftete Konvertierung in Frequenzfolgen, wie sie im menschlichen Ohr stattfinden.

Außerdem ändern sich die Werte der Audiosamples sehr schnell und es gibt selten Folgen von gleichen Bytes, weswegen allgemeine Datenkompressionsalgorithmen nicht gut funktionieren.

Die verlustfreien Audiocodecs unterscheiden sich von allgemeinen Algorithmen zur Datenreduktion dadurch, dass sie speziell an die typische Datenstruktur von Audiodateien angepasst sind. So können Audiocodecs Ähnlichkeiten zwischen den Kanälen (links, rechts) oder eine bestimmte Samplerate (44,1 kHz) als Voraussetzung für die zu komprimierenden Daten annehmen. Dies hat zur Folge, dass die Audiocodecs in fast allen Fällen Audiodateien besser komprimieren als z. B. die ZIP- oder RAR-Algorithmen. Die Kompressionsrate von CD-Tracks liegt meist zwischen 25 und 70 Prozent, aber häufiger im unteren Teil dieses Bereichs.

Bei verlustfreien Codecs gibt es keine Qualitätsunterschiede des Audiosignals, weswegen man die Auswahl anhand folgender Eigenschaften treffen kann:

Beispiele

Verlustbehaftete Kompression

Die meisten verlustbehafteten Kompressionsalgorithmen basieren auf simplen Transformationen, wie der "modifizierten diskreten Kosinus-Transformation" (MDCT), welche die aufgenommene Wellenform in ihre Frequenzabfolgen umwandeln. Einige moderne Algorithmen benutzen Wavelets, aber es ist noch nicht sicher, ob solche Algorithmen besser funktionieren als die auf MDCT basierenden.

Die meisten Algorithmen versuchen nicht den mathematischen Fehler zu reduzieren, sondern die subjektive menschliche Wahrnehmung der Tonfolgen zu verbessern. Da das menschliche Ohr nicht alle Information eines ankommenden Tones analysieren kann, ist es möglich, eine Sounddatei stark zu verändern, ohne dass die subjektive Wahrnehmung des Hörers beeinträchtigt wird. So kann ein Codec zum Beispiel einen Teil der sehr hohen und sehr tiefen Frequenzen (welche für Menschen fast unhörbar sind) weglassen. Auf ähnliche Weise werden Frequenzen, die durch andere Frequenzen überlagert sind, mit geringerer Genauigkeit wiedergegeben. Eine andere Art der Überlagerung ist, dass ein leiser Ton nicht erkennbar ist, wenn er unmittelbar vor oder nach einem lauten Ton kommt. Ein solches Modell der Ohr-Gehirn Verbindung, welches für diese Effekte verantwortlich ist, wird häufig psychoakustisches Modell (psychoakustisches Modell) genannt (auch:"Psychoaccoustic Model", "Psycho-model" oder "Psy-model"). Ausgenutzt werden hierbei Eigenschaften des menschlichen Gehörs wie Frequenzgruppenbildung, Hörbereichsgrenzen, Maskierungseffekte, Signalverarbeitung des Innenohrs.

Aufgrund der Natur der verlustbehafteten Algorithmen verschlechtert sich die Qualität, wenn eine solche Datei dekomprimiert und anschließend wieder komprimiert wird (Generationsverluste). Das passiert in der Praxis vor allem, wenn eine Audio-CD aus verlustbehafteten Audiodateien gebrannt wird (Audio-CDs sind unkomprimiert) und diese später wieder komprimiert wird. Dies macht verlustbehaftete Dateien sehr ungeeignet für Anwendungen in professionellen Tonbearbeitungsbereichen. "Data reduction is Audio destruction". Allerdings sind solche Dateien sehr beliebt bei Endbenutzern, da ein Megabyte je nach Komplexität des Tonmaterials ungefähr für eine Minute Musik bei annehmbarer Qualität reicht, was einer Kompressionsrate von ca. 1:11 entspricht.

Beispiele

Bei den Beispielen werden, soweit bekannt, auch die Bitraten angegeben, bei denen eine komprimierte Datei kaum mehr vom Original unterscheidbar ist -- bei konzentriertem Zuhören mit gutem Zubehör und einem ausgereiften Codec des jeweiligen Kompressionsschemas; abhängig von der Art der Musik. Die Bitrate von CDs ist 1411,2 kbps (Kilobit pro Sekunde).

Siehe auch

Weblinks

Vergleiche verlustfreier Audio-Codecs (Weblinks)

See also: Audiokompression, ATRAC, Advanced Audio Coding, Algorithmus, Apple Lossless, Audio, Bildkompression, Codec, Dateien, Datenkompression