Das MP3-Format – eine technische Revolution aus der Umgebung

Das MP3-Format ist aus unserem Alltag nicht mehr wegzudenken. Fast jedes Handy und jeder Computer unterstützt das Format heute, zum Beispiel zur Speicherung von Hörbüchern, Podcasts und Musik. Bei dem Format handelt es sich um ein Verfahren, das es ermöglicht, Audiodateien für die menschliche Wahrnehmung verlustfrei zu komprimieren. Es wurde in Erlangen am Fraunhofer-Institut entwickelt und seit dem ursprünglichen Release in 1991 stetig verbessert und dadurch immer effizienter. Durch die Komprimierung kann der benötigte Speicherplatz für Audiodateien um etwa 85 % verringert werden. Aber wie ist das überhaupt möglich? Anlässlich der 22. Tage der angewandten Naturwissenschaften hält Prof. Dr.-Ing. Bernhard Grill einen Vortrag über die Funktionsweise des MP3-Formats und warum es zu einem wesentlichen Bestandteil des Internets geworden ist.

Prof. Dr.-Ing. Bernhard Grill während seines Vortrags

Professor Dr.-Ing. Bernhard Grill war selbst an der Entwicklung des MP3-Formats beteiligt. Nach seinem Abitur am AKG studierte er Elektrotechnik an der Friedrich-Alexander-Universität in Erlangen. Anschließend begann er mit Kollegen das revolutionäre Audioformat zu entwickeln. In seinem Vortrag möchte Prof. Dr.-Ing. Bernhard Grill aber weniger über sein Leben berichten. Stattdessen möchte er anhand der Methoden der Datenkomprimierung erklären, wie die technische Revolution des MP3-Formats überhaupt möglich war und seine Zuhörer dadurch für Naturwissenschaften faszinieren.

Wie funktioniert das MP3-Format?

Professor Dr.-Ing. Bernhard Grill erklärt, dass die Effizienz des MP3-Formats auf den Limitierungen unseres Gehörs basiert. Eine unkomprimierte Audiodate enthält Informationen, die das menschliche Gehör nicht wahrnehmen kann. Deshalb können bestimmte Variablen so verändert werden, dass sich der Speicherplatz der Datei verringert, ohne dass wir den Informationsverlust wahrnehmen können. Dabei bedienen sich die Entwickler mehrerer Tricks aus der Psychoakustik. Diese beschäftigt sich damit, wie der Mensch Schallwellen (z.B. Musik, oder Stimmen) wahrnimmt.

Eine Kategorie der Tricks, die sich das MP3-Verfahren zu Nutze macht, sind Maskierungseffekte. Nachdem ein sehr lauter Ton gespielt wird, bleibt unser Gehör kurzzeitig unsensibel für leise Töne. Besonders stark ist dieser Effekt, wenn sich die beiden Töne eine ähnliche Frequenz besitzen. Das MP3 Verfahren ist darauf spezialisiert, solche nicht wahrnehmbaren Töne ausfindig zu machen und dann aus der Datei zu entfernen.

Eine weitere Limitierung unseres Gehörs ist der Frequenzbereich. Mit zunehmendem Alter wird es immer schwerer sehr hohe Töne wahrzunehmen, doch schon von Geburt an ist der durchs menschliche Ohr wahrnehmbare Frequenzbereich auf ca. 20 Hz bis 20 kHz begrenzt. Hinzu kommt, dass günstige Lautsprecher hohe Frequenzen nicht sauber wiedergeben können. Deshalb kann man auch in diesem Bereich viele überflüssige Daten löschen und die Dateigröße weiter verringern.

Der Dynamikumfang gibt die Differenz zwischen dem leisesten und dem lautesten Ton an. Jedoch ist auch dieser durch das menschliche Gehör begrenzt und im Alltag oft zusätzlich (z.B. durch Hintergrundgeräusche) eingeschränkt. Gut sichtbar wird das bei einem Orchester, denn bei sehr lauten Passagen können leise Instrumente untergehen.

Mein Fazit zu den 22. Tagen der Naturwissenschaften

Professor Dr.-Ing. Bernhard Grill hat gezeigt, dass das MP3-Format trotz seiner Komplexität auf einfache Tricks zurückgreift. Dabei funktioniert es nur deshalb so gut, weil unser Gehör limitiert ist und sich das Verfahren diese Limitierungen zu Nutze macht.  Für mich ist genau das, das Faszinierende an Naturwissenschaften, denn die Komplexität in der Wissenschaft liegt meistens auf dem Weg zur Lösung und weniger in der Lösung selbst.
 

Text: Tim Schindler, P12

Fotos: Semih Durak, 8b

Hinterlasse einen Kommentar