Lo standard MP3
Analizziamo ora in maggior
dettaglio lo standard MP3. Premessa indispensabile è la sigla MPEG, che sta per Motion
Picture Experts Group e indica un gruppo di ricercatori che studia nuovi formati per la
codifica e la riproduzione di audio e video; con questa sigla si indicano i diversi
formati di compressione audio video nati da questo progetto. Il termine MP3 è in realtà
un'abbreviazione di MPEG 1 Layer 3, cioè del formato di compressione audio (Layer,
per l'appunto) utilizzato nell'algoritmo MPEG 1. Riassumendo, pertanto, l'MPEG è una
serie di algoritmi di compressione per la riproduzione audio-video; i Layer sono gli
algoritmi di compressione utilizzati nella riproduzione MPEG per il solo audio; l'MPEG 1
Layer 3, meglio noto come MP3, è uno degli algoritmi di compressione per l'audio
utilizzati dall'algoritmo MPEG 1.
Quali sono i principi sui
quali si basa la compressione del formato MP3? Si tratta di due:
principio delle frequenze non udibili: se vi sono sorgenti sonore poste
vicino ad altre sorgenti sonore ma di intensità maggiore, le prime non saranno percepite
dall'orecchio; con un esempio, se un usignolo canta accanto ad una automobile accesa, è
pressoché impossibile che l'orecchio percepisca il canto dell'usignolo dato che ha una
intensità sonora decisamente inferiore a quella del rombo del motore dell'automobile.
Eliminare quella sorgente sonora significa rinunciare ad alcune informazioni audio che non
sarebbero state comunque percepite dall'orecchio, ottenendo un file di dimensioni
inferiori.
principio dei segnali meno importanti: all'interno dello spettro sonoro,
cioè delle frequenze udibili dall'orecchio umano, esistono alcune frequenze che possono
essere considerate meno importanti di altre per la fedeltà riproduttiva; togliendo queste
la dimensione del file audio si riduce.
Durante la fase di
compressione è possibile intervenire su tre tipi di variabili:
tipo di canale: stereo e
mono; il segnale stereo è più fedele ma porta ad un raddoppio delle dimensioni
complesive rispetto a quello monofonico. E' possibile adottare un nuovo tipo di
tecnologia, la Joint stereo, con la quale viene utilizzata la modalità mono quando questa
non comporta una perdità di qualità del segnale audio (ad esempio, parlato, o sorgente
sonora frontale), passando allo stereo non appena questo si renda necessario per mantenere
la fedeltà della riproduzione.
frequenza del campione o
frequenza di campionamento: indica il numero di campioni, cioè di misurazioni prese dalla
sorgente originaria, effettuate al secondo. A valori più elevati corrispondono più
campioni al secondo, con una qualità riproduttiva superiore ma dimensioni
proporzionalmente maggiori.
dimensione del campione in
bit: il segnale originario o sorgente è in forma analogica, pertanto di onda; la
trasformazione di questo segnale in digitale prevede la fase di campionamento, cioè il
segnale audio viene misurato ad intervalli di tempo prefissati (la frequenza di
campionamento illustrata poco sopra indica esattamente la frequenza di queste
rilevazioni); i valori ottenuti da questa misurazione possono essere più o meno precisi,
e tale livello di precisione dei campioni è indicato dalla dimensione del campione in
bit: a dimensioni superiori corrisponde una fedeltà del segnale audio superiore ma anche
un file audio di dimensioni più elevate.

Immagine presa da MP3News
|
Un CD audio contiene audio
campionato a 44.100 Hz (cioè 44.100 volte al secondo), con campioni di ampiezza pari a 16
bit. L'immagine in alto a sinistra riproduce il segnale analogico, mentre quella a destra
è lo stesso segnale ma convertito in digitale, a 44.100 Hz e 16 bit di profondità. Le
due immagini sottostanti riproducono, rispettivamente, due dei possibili casi: frequenza
di campionamento dimezzata a 22.000 Hz con profondità di 16 bit e frequenza di
campionamento sempre a 44.100 Hz e profondità dei campioni di 8 bit; in entrambi i casi
si ha una perduta di informazioni rispetto al segnale digitale a 44.100 Hz e 16 bit, ma
quale vantaggio si ottengono dimensioni del file audio più ridotte. |
A differenti frequenze di campionamento e
profondità del campione, pertanto, sarà possibile ottenere files di dimensioni e
qualità audio differenti. L'MPEG 1 Layer 3 prevede frequenze di campionamento di
32, 44.1 e 48K, con ampiezze di banda comprese tra i 320 Kbps e i 32 Kbps.
Vediamo con un esempio pratico come il
bitrate, cioè l'ampiezza di banda, vada a influenzare le dimensioni dei files MP3
ottenibili. A partire da un file wav di 50 Mbytes di dimensione, si possono ottenere i
seguenti files MP3:
| Bitrate |
Dimensioni |
Rapporto di compressione
(% della dimensione originaria) |
Minuti di files memorizzabili
nella memoria di default di Rio |
| 320 kbps |
11.637K |
23.3% |
~14 minuti |
| 256 Kbps |
9.310K |
18.62% |
~17 minuti |
| 224 Kbps |
8.146K |
16.31% |
~19 minuti 30 secondi |
| 192 Kbps |
6.983K |
13.96% |
~23 minuti |
| 160 Kbps |
5.819K |
11.64% |
~27 minuti 30 secondi |
| 128 Kbps |
4.655K |
9.31% |
~34 minuti 20 secondi |
| 112 Kbps |
4.073K |
8.15% |
~39 minuti 20 secondi |
| 96 Kbps |
3.492K |
6.98% |
~46 minuti |
| 80 Kbps |
2.910K |
5.82% |
~55 minuti |
| 64 Kbps |
2.328K |
4.65% |
~1 ora 9 minuti |
| 56 Kbps |
2.037K |
4.07% |
~1 ora 18 minuti 30 secondi |
| 48 Kbps |
1.746K |
3.49% |
~1 ora 30 minuti 40 secondi |
| 32 Kbps |
1.164K |
2.32% |
~2 ore 7 minuti 30 secondi |
L'output ottenuto è Stereo; è possibile
ottenere files MP3 di dimensioni leggermente inferiori utilizzando le opzioni Joint Stereo
e Bitrate Variable, anche se con impatti negativi sulla qualità audio dei files ottenuti.
Come si può facilmente notare, il tipo di compressione scelta ha impatti rilevanti sulle
dimensioni complessive dei files MP3 ottenuti, e di conseguenza sulla quantità di memoria
occupata. Utilizzare un fattore di compressione più elevato ha, quale logica conseguenza,
la perdita di qualità audio del file ottenuto; il miglior compromesso, per un impiego
generico quale quello di Rio, è di adottare un bitrate di 128kbps, eventualmente
inferiore (fino al limite minimo di 64 kbps) se si desidera memorizzare un maggior
quantitativo di files musicali e si accetta il compromesso di una qualità audio
inferiore.
|