Post on 05-Apr-2015
transcript
Medien-Technik
Audio-Kompression: MPEGKarlheinzBrandenburg
BernhardGrill
HaraldPopp
Medien-Technik
Audio-Kompression: MPEG
MPEG 1:ISO/IEC IS 11172 (1988-1992)
Ziel: Digitales Video auf CD 1,5 Mbit/s
MPEG 1 Audio:ISO/IEC IS 11172-33 Schichten wachsender Komplexität
MPEG 1 Layer 3 = MP3
Moving
Pictures
Experts
Group
Offizieller NameISO/IEC JTC1/SC29/ WG11
Medien-Technik
Audio-Kompression: MPEG
MPEG 2:(1994)
Ziel: Digitales Fernsehen, viele Bitratenz.B. DVD, Videokonferenzen
MPEG 2 Audio:ISO/IEC 13818-3Zusätzlich: 5-Kanal (Dolby Suround)Kleinere Bitraten / Abtastfrequenzen
AAC = MPEG 2 Advanced Audio CodingVerbesserte Codecs
Moving
Pictures
Experts
Group
Offizieller NameISO/IEC JTC1/SC29/ WG11
Medien-Technik
Komprimierung: MP3
Komressions-Rate für CD-Qualität
1:4 Layer 1 (384 kbps for a stereo signal)
1:6...1:8 Layer 2 (256..192 kbps for a stereo signal)
1:10...1:12 Layer 3 (128..112 kbps for a stereo signal)
MPEG Layer-3sound quality bandwidth mode bitrate reduction ratio
telephone sound 2.5 kHz mono 8 kbps * 96:1
better than shortwave 4.5 kHz mono 16 kbps 48:1
better than AM radio 7.5 kHz mono 32 kbps 24:1
similar to FM radio 11 kHz stereo 56...64 kbps 26...24:1
near-CD 15 kHz stereo 96 kbps 16:1
CD >15 kHz stereo 112..128kbps 14..12:1
Medien-Technik
Original-Spektrogramm aus der „Pastorale“
http://www.kfs.oeaw.ac.at/fsf/psa/index.html
Komprimierung: Psycho-Akustik
Audio-Software
ST-X
Medien-Technik
Akustisch relevante Anteile
HörbarerAnteil
Komprimierung: Psycho-Akustik
Medien-Technik
Differenz-Signal ohne „relevante“ Komponenten: „unhörbar“
VerdeckteKomponenten
Komprimierung: Psycho-Akustik
Medien-Technik
Psychoakustik:Critical Band =FrequenzbereichegleicherLaut(stärke)empfindung
Komprimierung: Psycho-Akustik
24 Kritische Bänderim Bereich 0-15 kHz
Medien-Technik
Komprimierung: Psycho-AkustikSimultane Maskierung
Hörbarkeitsschwelle
unhörbar
Unhörbar bei 1000Hz-Ton mit 100dB
http://www.tecchannel.de/multimedia/58/index.html
Medien-Technik
Komprimierung: Psycho-AkustikVerdeckung durch kurzes lautes Signal
http://www.tecchannel.de/multimedia/57/index.html
(tonal)
(Rauschsignal)
Rauschsignale werden durch lauteretonale Signale verdeckt.Konsequenz:Quantisierungsrauschen wird verdeckt.
Medien-Technik
Komprimierung: Psycho-AkustikVor- und Nachmaskierung
http://www.tecchannel.de/multimedia/57/index.html
Rückwärtsmaskierung:Lauter Impuls „überholt“leises Rauschhen
20 ms 200 ms
Vorwärtsmaskierung:Lauter Impuls hebt dieHörschwelle an
Medien-Technik
Jeweils um 10 dB ansteigendes Testsignal im Rauschsignal
Hörbeispiel 1: Rauschen verdeckt einzelne Töne
Testsignal 600 Hz
Rauschsignal 900-1100 Hz
Testsignal 1000 Hz
Testsignal 1600 Hz
Demo1.wav
Medien-Technik
Jeweils um 10 dB ansteigendes Testsignal im Rauschsignal
Hörbeispiel 2: Vorwärtsmaskierung
Impuls
Demo2.wav
Rauschsignal
Medien-Technik
Hörbeispiel 3: Rückwärtsmaskierung
Impuls
Demo3.wav
Rauschsignal
Medien-Technik
MPEG 1 AudioSub-Band Coding SBC
QMFQuadrature Mirror FilterVLCvariable-length coding
Medien-Technik
MPEG 1/2 Audio Layer 3
Zerlegung in 32 Frequenzbänder
Jedes Band18 mal zerlegen
Medien-Technik
MPEG 1/2 Audio Layer 3
Zerlegung in 32 Frequenzbänder
Jedes Band18 mal zerlegen
Verdeckte Komponenten ermitteln
Innere Schleife: Optimale Codierung
finden (Bitrate)Mehrere Hufman-Tabellen, VerstärkungsfaktorenStarkes Signal = grobe Kodierung, schwaches Signal = feine Codierung
Störsignalminimieren
Medien-Technik
MPEG 1/2 Audio Layer 3
Zerlegung in 32 Frequenzbänder
Jedes Band18 mal zerlegen
Verdeckte Komponenten ermitteln
Entropie-Kodierung
Aufbau
Frames
Medien-Technik
MPEG 1/2 Audio Layer 3
http://www.iis.fhg.de/amm/techinf/layer3/layer3_block.gif
Medien-Technik
Mp3 Bitstream
Header:Copyright 2bitsSyncword: 12bitsLayercode: 2bits (I,II,II)Bitrate: 4bits (s. Tabelle)Sampling-F.: 2bits (48,44.1,32 kHz)Mode: 2bit (stereo, mono, 2-sprachig, joint stereo)Padding 1bit
Jeder Framekann für sichdekodiert werden
Jeder Framekann andereSamplingrateund Modusbesitzen (III)
Joint Stereo:o MS-Stereo:
Mittensignal,Seitensignal
o Intensity Stereonur hörbare Differenzen
Medien-Technik
MPEG 1 Layers / BitratenBitrate (kHz)
Index Layer I Layer II Layer III
0000 frei frei frei
0001 32 32 32
0010 64 48 40
0011 96 56 48
0100 128 64 56
0101 160 80 64
0110 192 96 80
0111 224 112 96
1000 256 128 112
1001 288 160 128
1010 320 192 160
1011 352 224 192
1100 384 256 224
1101 416 320 256
1110 448 384 320
44,1 kHztypewriter1.wav3,8 MB
Typewriter1-1.mp3834 kB, joint stereo
Typewriter1-2.mp3342 kB, joint stereo
Typewriter1-3.mp3171 kB, joint stereo
Typewriter1-4.mp343 kB, joint stereo
Medien-Technik
Psychoakustik in MPEG
Modell I:FFT (512/1024) Werte und Bandfilter berechnenSchalldruck in jedem BandStille Regionen berechnenTonale und nichttonale verdeckende Komponenten aus FFTVerdeckte Komponenten entfernen
Modell II:FFT in wie in Modell I,jedoch für kurze (192) undlange Blöcke (576)Spreading function auf benach-barte Critical Bands anwenden
Medien-Technik
MPEG Audio Übersicht
MPEG-1Iso/IEC 11172-3 (1993)mono/stereo/2-channel/jointAbstastraten 48, 44.1, 32 KHz
MPEG-2Iso/IEC 13818-3 (1995)Iso/IEC 13818-7 (1997)mono/stereo/multichannelviele Abstastraten, Daten-ströme < 64 kBit/sec, AAC
Layer I
Layer II
Layer III
Ziel: Video & Audio-CD Kommunikation
Http://sound.media.mit.edu/mpeg4/audio/faq
Medien-Technik
MPEG 4 Audio
MPEG-7Multimedia ContentDescription Interface
Http://sound.media.mit.edu/mpeg4/audio/faq
Medien-Technik
MPEG 4 Natural Audio
Code ExcitedLinear Predictive
MPEG-2 AAC
HarmonicVectoreXcitationCoding
Medien-Technik
MPEG 4 Synthesized Audio
TTSI Text to Speech Interface Text mit Ausspracheinformationen
Score driven Synthesis
SAOL Structured Audio Orchestra Language Instrumente definieren
als Sammlung einfacher Signalprozessoren Noten für diese Instrument (abstraktes MIDI) Wavetables mit Effektfiltern
Medien-Technik
Vorlesung „Medientechnik WS 1999/2000“
Dr. Manfred JackelStudiengang ComputervisualistikInstitut für InformatikUniversität Koblenz-LandauRheinau 156075 Koblenz
© Manfred JackelE-Mail: jkl@uni-koblenz.de
WWW: www.uni-koblenz.de/~jkl
mtech.uni-koblenz.de
Literatur zu diesem Kapitel
Brandenburg, Karlheinz:MP3 and AAC explained
Hyperlinks zu diesem Kapitel Grafik-Quellen