MP3-Basics: Das müssen Sie wissen!

Die Musikindustrie zittert vor MP3, aber aufhalten kann sie es nicht. Das Kⁿrzel "MP3" bezeichnet einen Standard fⁿr die Kompression von Audiodaten. MP3 dampft digital gespeicherte Musikstⁿcke auf ein Zw÷lftel ihrer ursprⁿnglichen Gr÷▀e ein, ohne da▀ dabei allzuviele Zwischent÷ne verlorengehen: Die WiedergabequalitΣt ist beeindruckend hoch, ein Unterschied zur CD kaum h÷rbar.

Grundlagen MP3
Plattenk÷nige gegen Musikpiraten
MP3-Dateien selbstgemacht
Verwaltungskram
Einfache Bedienung trotz vieler Funktionen
Tempo: nicht essentiell, aber doch wichtig
Internet statt Ladentisch
Die Titeldatenbank im Internet
MP3: Neues von gestern
Kampf um Marktanteile
Was ist "MPEG 2.5 Audio Layer III"
Was ist der Trick an MP3?
Ein paar Worte und eine Grafik zur Qualität
Programmierer-Informationen

Grundlagen MP3

MPEG 2.5 Audio Layer III (mp3) ist ein Audio-Format, welches eine hohe Kompression von Audio Daten bei sehr geringem QualitΣtsverlust erm÷glicht. Der Frequenzumfang und Rauschabstand bleiben quasi erhalten. Eventuelle Verluste sind selbst auf "guten" Hifi-Anlagen kaum h÷rbar - vorausgesetzt die Dateien wurden entsprechend erstellt. Dazu erfahren Sie mehr in den folgenden Bereichen der FAQ. Das Kompressionsverfahren basiert darauf, da▀ "unh÷rbare" Audio-Informationen entfernt werden. Viele T÷ne werden durch andere ⁿberlagert, andere werden vom menschlichen Ohr nicht wahrgenommen, da sie au▀erhalb eines bestimmten Frequenzbereiches liegen. Dies mag einige "High-End-Musikkonsumenten" zum Haareraufen veranlassen, die Unterschiede des Komprimierten zum Original sind jedoch verschwindend gering und die Ersparnis an Datenmenge enorm - Stereo-Musik lΣ▀ sich um den Faktor 1:10 verkleinern. Diese hohe Kompression bietet viele neue M÷glichkeiten. Es ist jetzt einfach, auch gro▀e Mengen von Musikdaten zu archivieren (z.B. passen ca. 11 Alben auf eine einfache CD!). mp3-Dateien k÷nnen erheblich schneller und kostengⁿnstiger ueber das Internet versendet werden als z.B. die weitverbreiteten, um ein Vielfaches gr÷▀eren wav-Dateien. Ursprⁿnglich wurde das Format von der Fraunhofer-Gesellschaft (FHG), jedoch als Kompressionsverfahren fⁿr Audio-KanΣle auf Video-CD's entwickelt. In diesem Bereich wird aber wohl das amerikanische AC-3 Format das Rennen machen. Ein weiterer Vorteil des mp3-Formats ist, da▀ es ein sogenanntes Headerless-File-Format ist. mp3-Dateien besitzen zwar einen Header, dieser ist jedoch nicht unbedingt n÷tig, um die Datei abzuspielen (ein Header ist ein Informationsblock am Anfang einer Datei). Diese Tatsache hat zur Folge, da▀ man durchaus ein Stⁿck aus der Mitte einer Datei "herausschneiden" und immernoch abspielen kann. Dadurch wird mit mp3 streaming m÷glich ist. Was ist streaming? Das bedeutet nichts anderes,als da▀ es m÷glich ist, mp3's direkt ⁿber das Internet zu h÷ren, vorausgesetzt die Bitrate ist nicht h÷her als die Geschwindigkeit des Internet Anschlusses. Die Bitrate ist die Menge Daten, die pro Sekunde ⁿbertragen werden mu▀, um kontinuierliches h÷ren zu erm÷glichen. Um eine CD-Σhnliche AudioqualitΣt zu erreichen, wird eine Bitrate von 128kb/s (128000 bit pro sekunde) ben÷tigt. Das bedeutet, da▀ zwei ISDN-Leitungen je 64kbit/s und eine "staufreie" Internetverbindung n÷tig wΣre, um mp3's direkt aus dem Internet abzuspielen. Diese Voraussetzungen k÷nnen derzeit - vor allem fⁿr den Privatgebrauch - kaum erfⁿllt werden. Daher nutzt man eine Kombination aus streaming und herunterladen der mp3-Datei. Bevor das eigentlich Abspielen beginnt, wird ein Teil des mp3s von der Software heruntergeladen und zwischengespeichert (buffering). Dieser Teil liegt dann lokal auf dem Rechner des H÷rers und kann problemlos abgespielt werden. WΣhrend dieser zwischengespeicherte Teil geh÷rt wird, lΣdt die Software automatisch im Hintergrund bereits das nΣchste Teilstⁿck herunter. Dadurch kann trotz langsamerer oder manchmal verz÷gerter Verbindung oft ein kontinuierliches Abspielen erreicht werden.

Plattenk÷nige gegen Musikpiraten

Kampf der Plattenindustrie gegen MP3

Der Plattenindustrie ist MP3 jedoch ein Greuel, denn mit diesem Verfahren kann nun jeder Freak seine Lieblings-CDs in handliche Audiodateien verwandeln und via Web der ganzen Welt zum Download offerieren. Unerschrockene Netzpiraten nutzen dieses Angebot und decken sich kostenlos mit neuer Musik ein. Ein paar Mausklicks genⁿgen, und in Minutenschnelle rauschen die gewⁿnschten Songs oder gar komplette Alben auf die heimische Festplatte. So hat sich im Internet lΣngst ein reger Austausch von Raubkopien entwickelt. Die um ihre UmsΣtze besorgte Phonoindustrie versucht, den Musikfreibeutern das Handwerk zu legen, wo es nur geht. Klaus Hellmann, Spezialist fⁿr Neue Medien bei EMI Electrola (http://www.emimusic.de/index.html), sucht beispielsweise regelmΣ▀ig das Internet nach MP3-Dateien ab. Entdeckt er illegal angebotene Files, schickt er zunΣchst eine E-Mail an den Betreiber der betreffenden Site. Das genⁿgt meist schon. "Bis jetzt hat noch jeder die kritischen Inhalte vom Netz genommen, normalerweise innerhalb von Minuten", behauptet Hellmann.

US-Labels jagen Musikpiraten

In den USA hingegen, wo das Gros der MP3-Musikpiraten unterwegs ist, wird mit hΣrteren Bandagen gekΣmpft. Ohne Vorwarnung verklagte der dortige Phono-Verband "Recording Industry Association of America" (RIAA, http://www.riaa.com) vergangenes Jahr Betreiber von Websites, die illegal Musik zum Download angeboten hatten. Mehrere Angestellte der RIAA surfen hauptberuflich durch das Web, immer auf der Suche nach urheberrechtlich geschⁿtzten Audiodateien. US-Unternehmen wie Intersect und Music Report bieten professionelle Hilfe bei der Pirsch auf Copyright-Verletzer. Um dieser Hatz zu entgehen, sind viele Schwarzkopierer in den "Internet-Untergrund" abgetaucht: Hei▀e Tips tauschen sie beispielsweise in Chat-Rooms aus, wo eine dauernde ▄berwachung unm÷glich ist. Funktionierende Sites mit Musik im MP3-Format stehen meist nur fⁿr wenige Tage im Netz, danach sind sie wieder verschwunden. Die Zahl frei zugΣnglicher, "schwarzer" MP3-Sites ist dadurch rapide gesunken, und fⁿr Interessenten wird es immer schwieriger, an MP3-Dateien populΣrer Musiktitel heranzukommen.

MP3-Dateien selbstgemacht

Will man seine CDs komplett oder auch nur teilweise in MP3-Dateien verwandeln, braucht man zwei verschiedene Programme: eines zum digitalen Auslesen und Umwandeln der Audiospuren in WAV-Dateien ("Grabben") und einen MP3-Encoder, der die Wave-Dateien dann in das MP3-Format konvertiert, also komprimiert. Hat man gehobene Ansprⁿche, kommt zwischen den beiden genannten Schritten noch ein weiterer, nΣmlich die Bearbeitung der Wave-Datei. Zumindest eine Normalisierung der LautstΣrke ist bei der Zusammenstellung von Samplern mit Stⁿcken von verschiedenen CDs fast immer notwendig, da diese meist einen unterschiedlichen Pegel aufweisen. Ebenso interessant kann der umgekehrte Weg sein: Aus dem Internet gezogene MP3-Dateien k÷nnen ⁿber einen Umweg ⁿber das Wave-Format in normale Audiodateien umgewandelt werden. Diese lassen sich dann nicht nur per PC oder MP3-Player abspielen, sondern auch auf normale Audio-CDs fⁿr die Stereoanlage oder das Auto brennen. Die hierfⁿr notwendige Konvertierfunktion findet man in einigen MP3-Playern wie Winamp oder Sonique.

Verwaltungskram

Verwaltungskram Da MP3-Dateien bei normalen Musikstⁿcken nur ungefΣhr 6 MByte gro▀ sind, bieten moderne Festplatten Platz fⁿr ein gigantisches Musikarchiv, ⁿber das man bald den ▄berblick verliert. Zumindest, wenn man kein Werkzeug zu dessen Verwaltung einsetzt. Dazu gibt es zwar einige spezielle Freeware-Programme, von einem echten All-in-one-Tool kann man aber erwarten, da▀ auch fⁿr diesen Zweck eine L÷sung geboten wird. Dazu kommen vielleicht noch etliche Sonderwⁿnsche, wie die automatische Ermittlung der Titelbezeichnungen einer CD per Internet-Datenbank (siehe "CDDB, die Titeldatenbank"), oder vielleicht der Transfer von MP3-Dateien auf einen externen Abspieler wie den Diamond Rio. Praktisch ist auch die Unterstⁿtzung anderer Audioformate wie Real Audio oder Microsoft Audio, um entsprechende Songs ins MP3-Format konvertieren zu k÷nnen und umgekehrt. Integrierte L÷sungen Fⁿr alle diese Aufgaben findet man einzelne, kleine Programme im Internet. Aber um das damit verbundene Jonglieren mit Dateien und Programmfenstern zu vermeiden, haben einige Hersteller die hier getesteten All-in-one-Tools entwickelt. Wie der Test auf den folgenden Seiten zeigt, kann von "All" allerdings nicht die Rede sein. Einige k÷nnten sich aber zumindest "Almost-All-in-one" nennen, denn sie bringen die meisten der n÷tigen und wⁿnschenswerten Funktionen mit. Folgende Elemente sind bei allen Kandidaten vorhanden:

MP3-Player
CD-Player
CD-Grabber mit angehΣngtem MP3-Encoder mit mindestens 128 KBit/s
analoges Aufnahmeprogramm als Alternative zum CD-Grabber

Das ist aber nur die Mindestanforderung. In diesem Test ist der Funktionsumfang die am h÷chsten bewertete Disziplin. Um dort punkten zu k÷nnen, mⁿssen m÷glichst viele sinnvolle Zusatzfunktionen enthalten sein.

Einfache Bedienung trotz vieler Funktionen

Es ist nicht einfach, so viele Funktionen ⁿbersichtlich und strukturiert unter eine OberflΣche unterzubringen. Dazu kommt, da▀ sich ein regelrechter Kult rund um die OberflΣchengestaltung von MP3-Software entwickelt hat: je ausgefallener, desto besser. Bei einem Programm, dessen Funktionen sich auf die Tasten Play, Stop und Pause beschrΣnken, geht das in Ordnung. Bei komplexer Audiosoftware wie den Tools in diesem Test st÷rt dies jedoch eher. Hier hΣtten sich die durchaus MP3-begeisterten PCpro-Tester eine OberflΣche in langweiligem, aber ⁿbersichtlichem Windows-Finish gewⁿnscht. Dazu kommt, da▀ man ein Programm zur Konvertierung von CDs in MP3-Files nicht tΣglich einsetzt. Entsprechend gering ist somit die Bereitschaft, sich durch eine lange Einarbeitungsphase zu quΣlen. Deshalb wird in diesem Test auch besonderes Augenmerk auf die Usability gelegt, also die M÷glichkeit, m÷glichst schnell, intuitiv und ergonomisch mit den Programmen arbeiten zu k÷nnen. In diesem Punkt machen sich auch die gr÷▀ten Unterschiede zwischen den fⁿnf Testkandidaten bemerkbar. Die Palette dessen, was die jeweiligen Entwickler fⁿr die beste OberflΣche halten, reicht von einem Button- und menⁿlosen Drag-and-drop-Konzept ⁿber sachliche, Windows-typische Fenster und Pulldown-Menⁿs bis zu einem Programmdesign, das eher an die Schmierereien gelangweilter Teenager an S-Bahnen erinnert.

Tempo: nicht essentiell, aber doch wichtig

Das Komprimieren von Wave-Dateien oder Audiospuren ist eine Σu▀erst rechen- und damit zeitintensive Aufgabe. In den einzelnen Programmen existieren verschiedene MP3-Kodieralgorithmen, die sich teils ganz erheblich in der Geschwindigkeit unterscheiden, mit der die Konvertierung ablΣuft. Es gibt im Internet zwar hei▀e Diskussionen darⁿber, ob bei den schnelleren Encodern auch die KlangqualitΣt der erzeugten MP3-Dateien schlechter ist. Aber auch die Verfechter dieser Theorie geben zu, da▀ ein solcher Unterschied allenfalls me▀-, aber nicht h÷rbar ist - zumal MP3 aufgrund seiner verlustbehafteten Kompression fⁿr Liebhaber von qualitativ hochwertiger Musik ohnehin kein Thema ist. Nun mag es zwar ziemlich egal sein, ob die Umwandlung eines 3-Minuten-Titels von einer CD ins MP3-Format zwei oder vier Minuten dauert. Wer aber ganze CDs oder sogar mehrere davon umsetzen will, spart mit einem flotteren Encoder durchaus die eine oder andere Stunde Rechenzeit. Darum nimmt PC Professionell in diesem Test eine Tempomessung vor, auch wenn deren Ergebnis nur einen geringen Einflu▀ auf das Gesamtergebnis hat.

Internet statt Ladentisch

Interessanterweise ist kein einziges der hier getesteten Programme in irgendeinem Laden zu bekommen, egal ob Computer- oder MusikgeschΣft. Die Hersteller setzen ausnahmslos auf den Direktvertrieb ⁿber das Internet, in der Regel gibt es aber zumindest eingeschrΣnkte Demoversionen kostenlos zum Testen. Ebenfalls online bezahlt man die Registrierungsgebⁿhr, woraufhin man entweder eine uneingeschrΣnkte Version downloaden darf oder per E-Mail einen Freischaltcode zugeschickt bekommt. Die EinschrΣnkungen vor der Registrierung beziehen sich entweder auf den verfⁿgbaren Funktionsumfang, etwa die maximal m÷gliche QualitΣt der erzeugten MP3-Files, oder eine Begrenzung der Laufzeit des Programms. Einziger Nachteil: Die Online-Registrierung erfordert stets eine Kreditkarte. Da▀ die Hersteller davon ausgehen, da▀ MP3-Interessierte automatisch auch ⁿber einen Internet-Zugang verfⁿgen, und deshalb auf andere Vertriebswege verzichten, ist dagegen gar nicht so abwegig.

Produkt Bewertungspunkte Bewertung

Jukebox 4.4 85 gut

Real Jukebox Plus 83 gut

Play & Record 2.1 72 befriedigend

Audio Manager 2.0 62 ausreichend

Virtuosa Gold 3.1 58 ausreichend

Die Titeldatenbank im Internet

Titel vom CD-Booklet abtippen ist passΘ, wenn man eine Internet-Anbindung hat. Binnen Sekunden besorgen Tools mit CDDB-Funktion alle Interpreten und Songnamen einer CD aus dem Web. Schon der erste Windows-CD-Player fⁿr Windows 3.11 bot die M÷glichkeit, die einzelnen Titel der Musikstⁿcke und den Namen der CD sowie des Interpreten im Klartext einzugeben. Diese Daten wurden zusammen mit einer Prⁿfsumme aus Titelanzahl und Einzellaufzeiten in der Textdatei cdplayer.ini gespeichert. Da praktisch niemals zwei CDs die gleiche Titelanzahl und zugleich die identischen Einzellaufzeiten haben, wirkte die Prⁿfsumme als elektronischer Fingerabdruck. Wann immer diese CD kⁿnftig eingelegt wurde, konnte das Abspielprogramm sie anhand der gespeicherten Daten einwandfrei identifizieren und die korrekten Titel anzeigen. Cdplayer.ini und diesen Mechanismus gibt es nach wie vor. Allerdings hat er ⁿber die Windows-Generationen hinweg den gleichen Nachteil behalten: Wie alle ini-Dateien unter Windows kann auch diese nur maximal 64 KByte gro▀ werden, was fⁿr etwa 100 CDs ausreicht. Diese EinschrΣnkung verhindert, eine riesige ini-Datei mit allen denkbaren CDs zu basteln und so fⁿr eine automatische Erkennung jeder Scheibe zu sorgen, ohne da▀ man die Daten zuvor per Hand eingeben mu▀. Deshalb entstand im Internet eine Alternative: Die Online-Datenbank CDDB arbeitet nach dem gleichen Prinzip wie cdplayer.ini, enthΣlt mittlerweile aber die Daten von etwa 450 000 CDs mit fast fⁿnf Millionen Musikstⁿcken. TΣglich kommen rund 500 EintrΣge hinzu. Fast alle CD-Abspielprogramme, Grabber und auch die hier getesteten All-in-one-Tools unterstⁿtzen das CDDB-Format und k÷nnen binnen Sekunden die korrekten Titel aus dem Internet holen - nur der Windows-eigene CD-Spieler kann das nicht. Der Hauptzweck von CDDB besteht darin, die ermittelten Titel gleich als Dateinamen in einer meist frei definierbarer Komposition aus Titel und/oder Interpret fⁿr konvertierte Wave- oder MP3-Files zu verwenden.

MP3: Neues von gestern

WΣhrend ich auf der diesjΣhrigen Comdex in Las Vegas wenig wirklich Neues entdeckte, hatte ich ein sehr interessantes Treffen mit Rainer Hoffmann, dem deutschstΣmmigen GeschΣftsfⁿhrer der Firma Micronas. Er fⁿhrte am Beispiel MP3 die in den USA ⁿbliche EinschΣtzung von Deutschland als Technologie-Entwicklungsland eindrucksvoll ad absurdum: In Amerika wird der Audio-Standard derzeit gro▀ vermarktet, und es wird schon mit den ersten B÷rsen-Millionen spekuliert. Aber die entscheidende Grundlagenforschung und die eigentliche Idee stammen aus Deutschland. Den Audio-Codec hat das Fraunhofer Institut bereits Ende der 80er-Jahre entwickelt. Mitte der 90er hat die damals in Freiburg ansΣssige Firma Micronas den ersten MP3-Decoder vorgestellt und marktreif gemacht. Zuvor wurde sie von zahlreichen Firmen abgewiesen, darunter auch vom AushΣngeschild Siemens. Micronas hat heute den Firmensitz unter anderem auch in den USA und ist Marktfⁿhrer bei der Herstellung von MP3-Decoder-Chips. Das ist ein Musterbeispiel fⁿr die globale Arbeitsteilung: Geniale Ideen, die in Europa nur auf taube Ohren sto▀en, werden in Amerika schnell erkannt und pragmatisch in Produkte umgesetzt, die im asiatischen Raum preiswert produziert werden. Zugegeben, die Amerikaner sind gut im Vermarkten, aber die Ideen kommen meist aus Europa. Aus einem Abfallprodukt wie dem MP3-Algorithmus, der aus dem Audio-/Videokompressionsstandard MPEG-1 hervorgeht, machen Amerikaner das gro▀e Geld und Europa schaut mit offenem Mund zu. Dennoch nagt in mir der Zweifel: K÷nnen Amerikaner wirklich besser verkaufen, oder verhΣlt sich der US-Konsument gegenⁿber Werbeversprechen einfach unkritischer?
Redakteur Hardware Frank V÷lkel

Kampf um Marktanteile

Nach dem Willen von Microsoft soll kⁿnftig MS Audio 4.0 den Standard fⁿr Musik-Downloads bilden. Das Kompressionsformat bietet angeblich bei gleicher Dateigr÷▀e bessere KlangqualitΣt als MP3. Doch nicht nur IBM und Microsoft wollen die erste Geige im Download-Orchester spielen. Unternehmen wie Liquid Audio, Lucent, AT&T, Sony oder Global Music Outlet treten mit jeweils eigenen VorschlΣgen an. Die rivalisierenden Konzepte haben aber bisher nur den Effekt, da▀ sie die Anwender verunsichern. Liquid Audios Genuine-Music-Standard, der MP3-Files mit einem digitalen Wasserzeichen versieht, hat noch den Vorteil, da▀ er auf einem vorhandenen Format aufbaut. Anwender k÷nnen also ihre Player weiternutzen. Die Standards von AT&T, Global Music Outlet und Lucent sind dagegen reine Solospieler. Passende AbspielgerΣte fⁿr diese Formate gibt es noch nicht. Au▀erdem hat die MP3-Konkurrenz viel zuwenig Musikmaterial vorzuweisen.

Das sind die Alternativen zu MP3:

IBM - Electronic Music Management System: Pilotprojekt mit BMG, EMI, Sony Music, Universal Music und Warner Music. Kooperation mit Real Networks. www.ibm.com/security/html/featmusic.html
Microsoft - MS Audio: Kompressionssoftware in Windows Media Technologies 4.0. Musik klingt angeblich besser als bei MP3. Der Windows Media Rights Manager organisiert die Lizenzbedingungen. www.microsoft.com/windows/windowsmedia
Liquid Audio - Genuine Music Coalition: Digitales Wasserzeichen für diverse Musikformate, darunter auch MP3. www.liquidaudio.com
AT&T - A2B Music Player 2.0: Kompressionsrate von 15:1 bringt schnelleren Download als MP3. Nach einer Gratis-Hörprobe zahlt der Kunde eine Lizenzgebühr zur Freischaltung der Musikdatei. www.a2bmusic.com
Lucent - Epac: Das Audioformat aus den Bell Labs bietet angeblich CD-Qualität bei gleicher Kompression wie MP3 (11:1). www.lucent.com
Global Music Outlet - MP4: Jedes Musikstück ist eine ausführbare Datei, benötigt daher keine Playersoftware. Copyright-Schutz durch digitales Wasserzeichen. www.globalmusic.com

Was ist "MPEG 2.5 Audio Layer III"

Heutzutage sind effektive Kompressions-Techniken (sog. codecs) für die Arbeit mit digitalen Audio- und Video-Daten unbedingt erforderlich. Datenreduktion von Tönen und bewegten Bildern ist ein Schwerpunkt jeder Multimediaanwendung. Bei den im Moment üblichen und machbaren Transferraten von Bussystemen (PCI,IDE,SCSI usw.) und den zur Verfügung stehenden Speicherkapazitäten (sowohl RAM als auch Festplatten o.ä.) wird sich dies in absehbarer Zeit wohl auch nicht ändern.
In den letzten Jahren hat es gerade im Bereich von Audio/Video (A/V) codecs einige Fortschritte gegeben, und obwohl sich neben MPEG noch weitere codecs entwickelt haben, wurde es vom ISO/IEC-Komitee, welches als das internationale Äquivalent zur deutschen DIN-Komission beschrieben werden kann, als Standard definiert.

Ohne Datenreduktion besteht ein digitales Audio-Signal typischerweise aus 16bit großen Sampels bei einer Samplingfrequenz die doppelt so groß ist, wie die Bandbreite des Signals (z.B. 44.1kHz bei der Audio-CD). Mit ein wenig Rechnerei kommt man schnell zu der Erkenntnis, daß man 1400 kilobit für eine Sekunde (oder etwa 10.3 MByte für eine Minute) Musikdaten in CD-Qualität benötigt. Mit dem MPEG codec läßt sich diese Datenmenge ohne hörbaren Qualitätsverlust auf etwa 1/12 reduzieren. Sogar ein Faktor von 1:24 soll einen besseren Klangeindruck vermitteln, als eine Datenreduktion durch Verringern der Samplingrate oder den Rückschritt auf 8bit Samples. Ausgenutzt werden dazu Eigenschaften des menschlichen Ohres. So nimmt das Ohr Töne im Frequenzbereich der menschlichen Stimme wesentlich differenzierter wahr als solche in anderen Bereichen. Weiterhin ist bereits länger bekannt, daß laute Töne andere leisere Töne überlagern. Detailliertes gleich im nächsten Abschnitt.

Mit MPEG Audio Kompression lassen sich folgende Kompressionsraten bei einer Qualität auf CD-Niveau erreichen:

1:4	für Layer 1 (entspricht 384 kbps für ein Stereo Signal)
1:6...1:8	für Layer 2 (entspricht 256..192 kbps für ein Stereo Signal)
1:10...1:12	für Layer 3 (entspricht 128..112 kbps für ein Stereo Signal)

Durch Auslassen des Stereo Effekts und/oder Verringern der Bandbreite (Frequenzumfang des Signals) lassen sich noch höhere Kompressionsraten bei geringeren Bitraten erreichen. Die folgende Tabelle stellt bekannte Soundqualitäten den entsprechenden Layer-3 Kompressionsfaktoren gegenüber:

Klangqualität Bandbreite Modus Bitrate Kompressionsfaktor

Telefon 2.5 kHz mono 8 kbps 96:1

besser als Kurzwelle 4.5 kHz mono 16 kbps 48:1

besser als Mittelwelle 7.5 kHz mono 32 kbps 24:1

ähnlich wie UKW 11 kHz stereo 56...64 kbps 26...24:1

fast CD 15 kHz stereo 96 kbps 16:1

CD >15 kHz stereo 112..128kbps 14..12:1

Diese Tabelle des FHG scheint insgesamt etwas großzügig in der Qualitätsbeurteilung zu sein. Man sollte für CD-Qualität 128kbps und fast CD-Qualität 112kbps ansetzen. Über die anderen Werte liegen z.Zt. keine Erfahrungen vor.

Was ist der Trick an MP3?

Allgemein gibt es zwei Möglichkeiten, um die erfordeliche Datenmenge zu reduzieren. Entweder man sampelt weniger oft, oder sampelt mit einer geringeren Auflösung als 16bit/sample. Um die Qualität zu erhalten, kann die Samplefrequenz nicht geändert werden. Das menschliche Ohr hört Frequenzen im Bereich von 20Hz bis 20kHz (Mittelwert). Nach der Nyquist-Theorie muß die Sample-Frequenz doppelt so groß sein, wie die höchste zu speichernde Frequenz. Auf Grund dessen wird also nicht die Frequenz sondern die Auflösung der Samples reduziert.

Nun, da wir das wissen, müssen wir auf die Auflösung der Sampels genauer eingehen:
Samples sind 16bit groß um einen ausreichend großen Signal-to-noise-Ratio (Signalrauschabstand, 's/n') zu erhalten. Dieses Rauschen entsteht gezwungenermassen beim Digitalisieren der Sounddaten und wird im Fachjargon Quantisierungsrauschen (quantisation noise) genannt. Für jedes Bit, welches man dem Sampel hinzufügt erhält man einen um 6dB bessere s/n (+6dB entspricht etwa einer Verdopplung der Lautstärke, oder einer Vervierfachung der Watt-Leistung). Eine Audio-CD hat einen s/n von etwa 90dB, was ausreicht, um dem menschlichen Ohr ein rauschfreies Signal zu bieten.

Was passiert nun, wenn die Grösse der Samples auf 8bit reduziert wird? Die Sounddaten werden mit einem hörbaren Hintergrundrauschen (noise floor) unterlegt, welches man in leisen Passagen deutlich hört. Laute Töne überlagern jedoch dieses Rauschen (masking effect), und genau dies ist der Schlüssel zur MPEG Audio Komprimierung. Die Wissenschaft, welche diese Phenomene bei der Verarbeitung von Tönen durch das menschliche Gehör und Gehirn analysiert, nennt sich psyco-acustics.

Am einfachsten durch ein Beispiel läßt sich erklären, wie MPEG sich diese Phenomene zu nutze macht. Nehmen wir an, wir haben zwei Töne, einen bei 1000Hz und den zweiten bei 1100Hz. Letzterer ist im Vergleich zum Ersten 18dB leiser. Der Ton bei 1100Hz würde vollkommen von dem bei 1000Hz überdeckt/maskiert werden, und somit unhörbar sein. Ein dritter Ton bei 2000Hz mit -18dB relativ zum 1000Hz Ton wäre wieder hörbar. Senkt man den Pegel dieses Tones auf -45dB ab, würde er jedoch wiederum maskiert. Eine direkte Folge davon ist, daß um den (lauten) 1000Hz Ton auch das Hintergrundrauschen maskiert wird. Daher kann in diesem Bereich die Größe der Samples ohne Qualitätsverlust reduziert werden, was weniger Daten/Sample entspricht und somit also eine Kompression erreicht wird.
Was sich hier mit drei Tönen noch recht einfach anhört, verlangt in einem komplexen Audio-Signal natürlich einigen frequenzanalytischen und mathematischen Aufwand.

Wie funktioniert nun ein MPEG Audio-coder ?
Er unterteilt das Frequenzspektrum eines Audio-Signals (20Hz bis 20kHz) in 32 sog. Sub-Bands. Nehmen wir nun mal an, im oberen Bereich von Sub-Band 8 liegt unser 1000Hz Ton mit einer Lautstärke von 60dB. Der Coder berechnet nun den masking effect und stellt fest, daß der masking threshold (Maskierungs Schwellenwert) für das komplette 8. Sub-Band 35dB unter diesem Ton liegt. Daraus resultiert eine benötigte S/N-Ratio von 60dB-35dB = 25dB, was einer Sampelgröße von 4 bit entspricht. Zusätzlich treten natürlich noch in allen neben dem Sub-Band 8 liegenden Bändern Maskierungseffekte auf, die mit dem Abstand zum Ursprungsband abnehmen. Diese Beeinflussung der Bänder untereinander, wird von den Coding-Routinen ebenfalls berücksichtigt, was die Berechnungen noch komplexer macht.

Die Aufteilung der Sub-Bands ist ebenfalls eine wichtige Komponente der Kodierung. Waren in Layer II noch alle 32 Sub-Bands gleich groß (625 Hz), so sind sie in Layer III an die Eigenschaften des Ohres angepasst - also kleiner in den empfindlicheren Bereichen, die im Bereich der menschlichen Stimme liegen (2 bis 4 kHz). Auch dies erfordert wiederum komplexere Filter. In diesem Punkt hat man auf eine bereits bestehende Filtertechnik zurückgegriffen, die DCT-Filter (Discrete Cosinus Transformation).

Der nächste vom Coder berücksichtigte Effekt ist das sogenannte Pre- & Postmasking. Findet in einem Soundsignal ein großer Sprung in der Lautstärke statt (min. 30 dB), so tritt ein Premasking Effekt auf, der um 2-5 Millisekunden maskiert, sowie ein Postmasking Effekt, der bis zu 100 ms abdecken kann. Die Theorien dazu besagen, daß dieser Effekt daraus resultiert, daß das Gehirn eine gewisse Zeit braucht, um eine solche Dynamik umzusetzen.

Der letzte Schritt vor der Formatierung der Daten ist das sog. Huffman-Coding. Es ersetzt lange, häuftiger vorkommende Datenketten durch kürzere und speichert diese Zuweisung nur einmal ab. Diese Art der Kodierung arbeitet verlustfrei und ist auch die Basis für altbekannte Kompressionsalgorithmen wie ZIP, LHA, RAR usw.

Alle diese masking effects und Kodierungen werden in einem iterativen Prozess berücksichtigt/berechnet, welcher bei Layer II mit 23 ms timewindows arbeitet, was bei sehr dynamikreichem Klangmaterial noch zu Problemen führen kann. Im Layer III Format hat man sich dieses Problems angenommen und die time windows verkürzt.

Endlich ist die Verwaltung einer privaten Musik-CD-Bibliothek kein Problem mehr. Sie lesen beliebige Musik-CDs aus und speichern die Musik-Daten komprimiert auf Fest- oder Wechselplatte ab. Nach Zusammenstellung Ihrer Lieblingstitel brennen Sie diese einfach auf CD und erstellen sich somit nach und nach Ihre ganz pers÷nliche Musik-CD-Bibliothek. Durch intelligente Kompressionsalgorithmen nehmen Sie keinen QualitΣtsverlust wahr. Unterstⁿtzt werden zusΣtzlich die allseits beliebten MP3-Audio-Dateien - damit haben Sie Zugriff auf zig-tausende frei verwendbarer Musikstⁿcke freier Musiker, die im Internet zur Verfⁿgung gestellt werden. Die Features im Einzelnen: MP3 Direkt und ohne Umweg auf AudioCDs brennen; Auslesen von Audiotracks ⁿber alle gΣngigen CD-ROM-Laufwerke; Unterstⁿtzung von nahezu allen gΣngigen CD-Brennern; Komprimieren von Audio-Dateien; Verwalten von Titeln und Interpreten; Unterstⁿtzung von MP3-Audio-Dateien; Automatische Pegelanpassung; Hohe AufzeichnungsqualitΣt durch Geschwindigkeitssteuerung und mehr. Bis zur Registrierung enthΣlt jede gebrannte CD als erstes Track einen 24-Sekunden Werbespot. (Shareware)

Ein paar Worte und eine Grafik zur Qualität

Es klingt zunächst unglaublich, daß trotz einer prinzipbedingt verlustbehafteten Kompression die Qualität weitestgehend erhalten bleibt. Wir haben daher eine Grafik erstellt, die dies ein wenig veranschaulichen soll.

Zur Entstehungsgeschichte: Mit einem CD-ROM wurde ein Lied von einer Audio-CD ausgelesen und die resultierende WAV-Datei einmal mit 128kbit/s und einmal mit 96kbit/s gepackt. Diese beiden mp3-Dateien wurden wieder in WAV-Dateien zurückgewandelt und in einen Wave-Editor geladen. Per Screenshot und einem Grafikprogramm wurden dann die drei Waveforms (nicht zu verwechseln mit einem Frequenzschrieb!) übereinandergelegt, eingefärbt und beschriftet.

Die Einheiten: Die Horizontale ist kaum erklärungsbedürftig - dies ist die Zeitachse. Zwischen den beiden senkrechten Linien liegen exakt 100 Samples, was bei einer Samplingfrequenz von 44.1 kHz ungefär 2.25 ms entspricht. Zur Vertikalen ein paar begleitende Dinge: Die Werte stehen hier in dB. DeziBel ist eines von verschieden Systemen eine Lautstärke zu beschreiben und ist eigentlich keine Einheit, sondern eine Rechenvorschrift, die das Verhältnis zweier Schalldrücke beschreibt. Um +/- 1 dB noch zu hören ist ein schon ein sehr feines und geübtes Gehör nötig. Näheres dazu z.B. in einer an der TU-Claustal veröffentlichten Studienarbeit.

Was sagt nun die Grafik aus? Man darf dieses Bild natürlich nicht als 100%iges Qualitätsmerkmal verstehen. sondern als einfacher Versuch bestehende Unterschiede zu zeigen. Wenn man sich den Zoomfaktor der Grafik mal versucht vorzustellen, kommt man leicht zu der Annahme, daß zwischen dem original (braun) und dem mit 128bit gepackten File (rot) keine hörbaren Unterschiede bestehen. Man sieht auch, daß das 96kbit-File insgesamt wesentlich weiter vom Original weg ist.

Programmierer-Informationen

Vorweg ein Dank an Christian Hesse, dessen Seite zum mp3-Header als Quelle diente.

Der Header beinhaltet Informationen zum nachfolgenden Datenstrom und wird von so gut wie allen Programmen ausgelesen. Der Header einer mp3-Datei ist folgendermaßen aufgebaut:

OffSet Bits Beschreibung

0 12 SyncWord

12 1 MPEG Version

13 2 MPEG Layer

15 1 Protection Bit

16 4 Bitrate

20 2 Samplingfrequenz

22 1 Padding Bit

23 1 Private Bit

24 2 Mode

26 2 Mode Extension

28 1 Copyright

29 1 Original Home

30 2 Emphasis

SyncWord (12bit)
Die Bedeutung der Sync. Word Bits ist unterschiedlich dokumentiert. Es sind 2 verschiedene Dokumentationen im Umlauf. Eine verlangt alle 12 bits auf 1 (FFFh), die andere nur die ersten 8 (FFh). Die ein oder andere mp3-Datei besitzt jedoch auch völlig andere SyncWord Bits.

MPEG Version (1bit)
Dieses Bit gibt an, ob es sich um MPEG 1 oder MPEG 2 handelt. Von diesem Bit sind die Bitrate und die Sampling Frequenz direkt abhängig. Ist dieses Bit auf 0 gesetzt, handelt es sich um MPEG 2, im anderen Fall um MPEG 1

MPEG Layer (2bit)

Diese 2 Bit beschreiben den verwendeten Audio-Layer und bestimmen zusammen mit der MPEG-Version die Bitrate.

Bit 13	Bit 14	Dezimal	Layer
0	0	0	nicht def.
0	1	1	Layer 3
1	0	2	Layer 2
1	1	3	Layer 1

Protection Bit (1bit)

Wenn das Protection Bit den Wert 0 enthält, soll nach dem Header ein Error-Check kommen. Die genaue Funktionsweise ist bisher undokumentiert.

Bitrate (4bit)

Die Bitrate ist wohl die wichtigste Information im Header: die mp3-Player erfahren hier, wieviel bit pro Sekunde decodiert werden und natürlich läßt sich, zusammen mit der Filegröße, die Spieldauer berechnen. Die mit diesen 4 Bit festgelegte Bitrate muß zur - in den Bits 12-14 festgelegten - MPEG-Version und zum MPEG-Layer passen.

Bit 16	Bit 17	Bit 18	Bit 19	Dezimal	MPEG 1 Layer I	MPEG 1 Layer II	MPEG 1 Layer III	MPEG 2 Layer I	MPEG 2 Layer II	MPEG 2 Layer III
0	0	0	0	0	-	-	-	-	-	-
0	0	0	1	1	32 kBit/s	32 kBit/s	32 kBit/s	32 kBit/s	32 kBit/s	8 kBit/s
0	0	1	0	2	64 kBit/s	48 kBit/s	40 kBit/s	64 kBit/s	48 kBit/s	16 kBit/s
0	0	1	1	3	96 kBit/s	56 kBit/s	48 kBit/s	96 kBit/s	56 kBit/s	24 kBit/s
0	1	0	0	4	128 kBit/s	64 kBit/s	56 kBit/s	128 kBit/s	64 kBit/s	32 kBit/s
0	1	0	1	5	160 kBit/s	80 kBit/s	64 kBit/s	160 kBit/s	80 kBit/s	64 kBit/s
0	1	1	0	6	192 kBit/s	96 kBit/s	80 kBit/s	192 kBit/s	96 kBit/s	80 kBit/s
0	1	1	1	7	224 kBit/s	112 kBit/s	96 kBit/s	224 kBit/s	112 kBit/s	56 kBit/s
1	0	0	0	8	256 kBit/s	128 kBit/s	112 kBit/s	256 kBit/s	128 kBit/s	64 kBit/s
1	0	0	1	9	288 kBit/s	160 kBit/s	128 kBit/s	288 kBit/s	160 kBit/s	128 kBit/s
1	0	1	0	10	320 kBit/s	192 kBit/s	160 kBit/s	320 kBit/s	192 kBit/s	160 kBit/s
1	0	1	1	11	352 kBit/s	224 kBit/s	192 kBit/s	352 kBit/s	224 kBit/s	112 kBit/s
1	1	0	0	12	384 kBit/s	256 kBit/s	224 kBit/s	384 kBit/s	256 kBit/s	128 kBit/s
1	1	0	1	13	416 kBit/s	320 kBit/s	256 kBit/s	416 kBit/s	320 kBit/s	256 kBit/s
1	1	1	0	14	448 kBit/s	384 kBit/s	320 kBit/s	448 kBit/s	384 kBit/s	320 kBit/s
1	1	1	1	15	-	-	-	-	-	-

Bit 20	Bit 21	Dezimal	MPEG 1	MPEG 2
0	0	0	44100 Hz	22050 Hz
0	1	1	48000 Hz	24000 Hz
1	0	2	32000 Hz	16000 Hz
1	1	3	-	-

Samplingfrequenz (2bit)

Die Samplingfrequenz, auch Sample Rate genannt, gibt an, wieviele Samples pro Sekunde benutzt werden, um die Kanginformation zu speichern. Einen Sample kann man sich als einen Frequenzpunkt vorstellen. Auf einer Audio-CD z.B. ergeben dann 44100 solcher Punkte pro Sekunde, einen Frequenzverlauf. Rein theoretisch ist natürlich jede beliebige Samplingfrequenz möglich, in der Praxis werden allerdings einige bestimmte Werte benutzt, und bei einer MPEG-Codierung sind die Samplingfrequenzen sogar den MPEG-Versionen zugeordnet.

Padding Bit (1bit)

Das Padding Bit gibt an, ob in einem Frame auch auch wirklich alle Bits genutzt werden (0), oder ob ungebrauchte Bit's aufgefüllt werden sollen (1).

Private Bit (1bit)

Das Private Bit steht zur freien Verfügung.

Bit 24	Bit 25	Dezimal	Mode
0	0	0	Stereo
0	1	1	Joint-Stereo
1	0	2	Dual-Channel
1	1	3	Mono

Mode (2bit)

Mit den beiden Mode-Bits wird unterschieden, ob das MP3 Stereo, Mono, Joint-Stereo oder Dual-Channel ist.

Bit 26	Bit 27	Dezimal	Layer 1 & 2	Layer 3
0	0	0	4	0
0	1	1	8	4
1	0	2	12	8
1	1	3	16	16

Mode Extension (2bit)

Wenn man im "joint Stereo" Modus codiert (hat), gibt dieses Bit an, an welche Frequenzbänder es gebunden ist.

Copyright (1bit)

Wenn das Copyright Bit gesetzt ist, ist der Inhalt des MP3-Files urheberrechtlich geschützt - ähnlich dem Copy Protection Bit auf Audio-CD's.

Original Home (1bit)

Wenn das Bit Original Home den Wert 1 enthält, handelt es sich um den Original MP3-Datenstrom - andernfalls um eine Kopie.

Bit 30	Bit 31	Dezimal	Emphasis
0	0	0	kein
0	1	1	50/15ms
1	0	2	- ? -
1	1	3	CITT j. 17

Emphasis (2bit)

Emphasis ist ein Überbleibsel aus der Anfangszeit der Audio-CD, welches heutzutage quasi gar nicht mehr verwendet wird, und war zur Rauschunterdrückung gedacht. Es arbeitet auf einer ähnlichen Basis, wie die Dolby«-Rauschunterdrückung für Audio-Cassetten. Dieses Verfahren hebt (grob gesagt) leise Frequenzen in der Lautstärke an, was natürlich bei der Wiedergabe berücksichtigt werden muß.

Der ID3-TAG

Der ID3-TAG ist recht simpel aufgebaut. Er ist 128 byte groß,und wird an das Ende eines MP3-Files angehängt (seek end -128B). Deshalb hier nur eine Tabelle:

Offset (end-128byte+x)	Anzahl der Bytes	Inhalt
0	3	'TAG' (Kennung, des TAG's selbst)
3	30	Titel des Stücks
33	30	Name des Interpreten
63	30	Name des Albums
93	4	Jahr der Veröffentlichung
97	30	Kommentar
127	1	Genre-Kennung

Eine Erweiterung ¹ des ID3-Tags (ID3 V1.1 getauft) wurde kürzlich mit der MP3-Info Extension von Michael Mutschler eingeführt, der die beiden letzten Byte des Kommentars nutzt, um dort die Nummer des Tracks auf einer CD zu speichern. Ebenfalls auf Herrn Mutschlers Seiten findet man eine immer aktuelle Liste der Genre Kennungen, sowie weitere Informationen zu ID3 V1.0 und V1.1.
Das "mp3-Info Ext."-Team arbeitet z.Zt. auch an einer neuen Version des ID3-TAG's (V2.0), dessen (vorläufige) Spezifikationen bereits feststehen.

¹ - Bei ID3-TAG's muß immer beachtet werden, daß dies kein offizieller Standard ist, sondern von Internet-Usern und Programmierern von Playern und ID3-Editoren erfunden und weiterentwickelt wurde/wird, um mehr Informationen als den Namen eines mp3-Files festzuhalten. Somit kann nicht davon ausgegangen werden, daß ID3-V1.1 oder die kommende V2.0 ähnlich schnell und umfassend Akzeptanz finden, wie die V1.0.