MPEG

Negli ultimi anni sono stati fatti notevoli progressi sulla compressione audio e video in relazione all'enorme crescita della rete internet; tutto questo ha portato alla nascita dello standard MPEG (Motion Picture Coding Experts Group).

Il problema di base e' stato quello di cercare degli algoritmi molto efficaci per il trattamento del segnale video e audio che potessero permettere di avere dei file di dimensioni non eccessivamente grandi: si pensi ad esempio che un file audio di qualita' CD (campionamento a 44.100 Hz, 16 bit stereo di 5 minuti) occupa circa 50 Mb.

MPEG e' nato nel gennaio del 1988 presso i laboratori CSELT di Torino con l'esigenza di sviluppare uno standard mondiale per la rappresentazione di immagini in movimento, di audio, di immagini e audio combinati assieme. I vari passi hanno portato alla nascita di versioni successive:

MPEG1: codifica del segnale audiovisivo combinato ad un bit-rate di circa 1.5 Mb/s con qualita' minore della TV. Come occupazione siamo intorno a 1.2 Mb/s per il video e 0.3 Mb/s per l'audio stereofonico.

Specifiche audio:

Frequenza di campionamento: 32, 44.1 e 48 kHz
Numero canali: 1 o 2
Modi di funzionamento: mono, dual-mono, stereo, joint-stereo
Bit-rate: 32-224 kb/s per canale
Bit-rate per buona qualita': 192 kb/s
Tre livelli di compressione (comunemente chiamati layers):
Layer I : e' il piu' semplice (bit-rate > 128 kb/s, poca compressione)
Layer II : piu' complesso (bit-rate = 128 kb/s)
Layer III : il piu' complesso (bit-rate = 64 kb/s, molta compressione)

MPEG2: codifica generica di fotogrammi in movimento con audio associato ad un bit-rate di circa 6 Mb/s con qualita' TV. Viene introdotta la gestione dei canali in surround.

MPEG3: pensato per l'introduzione della televisione ad alta definizione, non e' stato sviluppato perche' assorbito dalle specifiche di MPEG2.

MPEG4: codifica ad oggetti. Le immagini cosi' come l'audio vengono ora visti come composti da diversi oggetti, questo per permettere la comunicazione multimediale.

Oggi si sente parlare anche di MPEG7 e MPEG 13...solo voci o nuove idee? Ci vorra' ancora un po' di tempo per saperlo. Ad oggi solo MPEG1 e' stato completamente standardizzato.

Ma allora, alla fine di tutto: MP3 da dove salta fuori? MP3 non sta per MPEG3 bensi' per MPEG1 Layer 3.

La compressione audio:
Per capire come e' possibile raggiungere delle compressioni cosi' elevate bisogna fare un cenno sulla psicoacustica; il segnale audio e' cio' che possiamo udire; le capacita' percettive dipendono quindi da individuo ad individuo ma con buona approssimazione l'udito umano e' sensibile alle frequenze comprese tra i 20 Hz ed i 20 kHz con maggior risalto tra i 2 e i 4 kHz. Dagli studi effettuati facendo ascoltare dei suoni a un campione di test e' emerso che se si emette un suono ad una determinata frequenza, con una certa energia, l'udito non sara' capace di percepire le frequenze immediatamente prossime anche se queste hanno volumi appena inferiori.
Questo fenomeno e' noto come mascheramento. In altre parole ad ogni frequenza e' associata una campana di mascheramento (banda critica) che varia da frequenza a frequenza, ed in particolare aumenta con il suo aumentare.
La psicoacustica occupa un ruolo molto importante nella codifica MPEG: la sola compressione, quella usata dai compattatori piu' famosi, non basta per ottenere dei risultati cosi' notevoli, questo perche' c'e' poca ridondanza nei dati in file audio.

L'algoritmo di compressione per quanto riguarda MPEG1 ha una struttura di base comune, cambia il calcolo del modello psicoacustico e delle subbande da layer a layer.

Per quel che riguarda MP3 (ricordiamo: MPEG1 Layer3) si e' cercato di ridurre al minimo il flusso di dati, questo ha portato ad una struttura piu' complessa rispetto al layer 1 e layer 2, con tempi di codifica piu' lunghi.

Non ha quindi senso chiedersi quale sia l'encoder migliore: la risposta spetta a voi, in relazione alle vostre esigenze. Potete scegliere tra encoder veloce e lento, fare paragoni con mp3 ottenuti da encoder diversi a parita' di bit-rate. Ricordate che piu' un encoder e' veloce e piu' si perde in fedelta' audio: questo e' difficile da percepire ascoltando MP3 dalle casse del computer, ma con un bel paio di cuffie le piccole distorsioni introdotte dalla compressione verranno a galla sicuramente.

Se poi si deve creare un MP3 con un basso bit-rate il consiglio e' di utilizzare encoder lenti; il bit-rate e' un parametro molto importante nella fase di compressione perche', insieme alla frequenza di campionamento, ai bit di dimensione di campionamento e ai canali usati, sono i principali parametri che influiscono sulla dimensione finale del file e sulla sua qualita' audio, legando queste 2 caratteristiche in maniera inversamente proporzionale, ovvero:

maggior bit-rate = maggior dimensione del file
minor bit-rate = minor dimensione del file

Articolo a cura di Steeve (sos@libero.it)

1