Diamond Rio

Diamond Rio

Analisi tecnica del player MP3 portatile Diamond Rio, modello dalle ridotte dimensioni che permette di ascoltare files MP3 in qualsiasi ambiente. All'interno dell'articolo è stata analizzata in dettaglio la tecnologia di compressione audio MP3.

di pubblicato il nel canale Multimedia
 

Lo standard MP3

Analizziamo ora in maggior dettaglio lo standard MP3. Premessa indispensabile è la sigla MPEG, che sta per Motion Picture Experts Group e indica un gruppo di ricercatori che studia nuovi formati per la codifica e la riproduzione di audio e video; con questa sigla si indicano i diversi formati di compressione audio video nati da questo progetto. Il termine MP3 è in realtà un'abbreviazione di MPEG 1 – Layer 3, cioè del formato di compressione audio (Layer, per l'appunto) utilizzato nell'algoritmo MPEG 1. Riassumendo, pertanto, l'MPEG è una serie di algoritmi di compressione per la riproduzione audio-video; i Layer sono gli algoritmi di compressione utilizzati nella riproduzione MPEG per il solo audio; l'MPEG 1 – Layer 3, meglio noto come MP3, è uno degli algoritmi di compressione per l'audio utilizzati dall'algoritmo MPEG 1.

Quali sono i principi sui quali si basa la compressione del formato MP3? Si tratta di due:

  • principio delle frequenze non udibili: se vi sono sorgenti sonore poste vicino ad altre sorgenti sonore ma di intensità maggiore, le prime non saranno percepite dall'orecchio; con un esempio, se un usignolo canta accanto ad una automobile accesa, è pressoché impossibile che l'orecchio percepisca il canto dell'usignolo dato che ha una intensità sonora decisamente inferiore a quella del rombo del motore dell'automobile. Eliminare quella sorgente sonora significa rinunciare ad alcune informazioni audio che non sarebbero state comunque percepite dall'orecchio, ottenendo un file di dimensioni inferiori.

  • principio dei segnali meno importanti: all'interno dello spettro sonoro, cioè delle frequenze udibili dall'orecchio umano, esistono alcune frequenze che possono essere considerate meno importanti di altre per la fedeltà riproduttiva; togliendo queste la dimensione del file audio si riduce.

Durante la fase di compressione è possibile intervenire su tre tipi di variabili:

  1. tipo di canale: stereo e mono; il segnale stereo è più fedele ma porta ad un raddoppio delle dimensioni complesive rispetto a quello monofonico. E' possibile adottare un nuovo tipo di tecnologia, la Joint stereo, con la quale viene utilizzata la modalità mono quando questa non comporta una perdità di qualità del segnale audio (ad esempio, parlato, o sorgente sonora frontale), passando allo stereo non appena questo si renda necessario per mantenere la fedeltà della riproduzione.

  2. frequenza del campione o frequenza di campionamento: indica il numero di campioni, cioè di misurazioni prese dalla sorgente originaria, effettuate al secondo. A valori più elevati corrispondono più campioni al secondo, con una qualità riproduttiva superiore ma dimensioni proporzionalmente maggiori.

  3. dimensione del campione in bit: il segnale originario o sorgente è in forma analogica, pertanto di onda; la trasformazione di questo segnale in digitale prevede la fase di campionamento, cioè il segnale audio viene misurato ad intervalli di tempo prefissati (la frequenza di campionamento illustrata poco sopra indica esattamente la frequenza di queste rilevazioni); i valori ottenuti da questa misurazione possono essere più o meno precisi, e tale livello di precisione dei campioni è indicato dalla dimensione del campione in bit: a dimensioni superiori corrisponde una fedeltà del segnale audio superiore ma anche un file audio di dimensioni più elevate.

 

intro_wave.gif (4660 byte)
Immagine presa da MP3News

Un CD audio contiene audio campionato a 44.100 Hz (cioè 44.100 volte al secondo), con campioni di ampiezza pari a 16 bit. L'immagine in alto a sinistra riproduce il segnale analogico, mentre quella a destra è lo stesso segnale ma convertito in digitale, a 44.100 Hz e 16 bit di profondità. Le due immagini sottostanti riproducono, rispettivamente, due dei possibili casi: frequenza di campionamento dimezzata a 22.000 Hz con profondità di 16 bit e frequenza di campionamento sempre a 44.100 Hz e profondità dei campioni di 8 bit; in entrambi i casi si ha una perduta di informazioni rispetto al segnale digitale a 44.100 Hz e 16 bit, ma quale vantaggio si ottengono dimensioni del file audio più ridotte.

A differenti frequenze di campionamento e profondità del campione, pertanto, sarà possibile ottenere files di dimensioni e qualità audio differenti. L'MPEG 1 – Layer 3 prevede frequenze di campionamento di 32, 44.1 e 48K, con ampiezze di banda comprese tra i 320 Kbps e i 32 Kbps.

Vediamo con un esempio pratico come il bitrate, cioè l'ampiezza di banda, vada a influenzare le dimensioni dei files MP3 ottenibili. A partire da un file wav di 50 Mbytes di dimensione, si possono ottenere i seguenti files MP3:

Bitrate Dimensioni Rapporto di compressione
(% della dimensione originaria)
Minuti di files memorizzabili
nella memoria di default di Rio
320 kbps 11.637K 23.3% ~14 minuti
256 Kbps 9.310K 18.62% ~17 minuti
224 Kbps 8.146K 16.31% ~19 minuti 30 secondi
192 Kbps 6.983K 13.96% ~23 minuti
160 Kbps 5.819K 11.64% ~27 minuti 30 secondi
128 Kbps 4.655K 9.31% ~34 minuti 20 secondi
112 Kbps 4.073K 8.15% ~39 minuti 20 secondi
96 Kbps 3.492K 6.98% ~46 minuti
80 Kbps 2.910K 5.82% ~55 minuti
64 Kbps 2.328K 4.65% ~1 ora 9 minuti
56 Kbps 2.037K 4.07% ~1 ora 18 minuti 30 secondi
48 Kbps 1.746K 3.49% ~1 ora 30 minuti 40 secondi
32 Kbps

1.164K

2.32% ~2 ore 7 minuti 30 secondi

L'output ottenuto è Stereo; è possibile ottenere files MP3 di dimensioni leggermente inferiori utilizzando le opzioni Joint Stereo e Bitrate Variable, anche se con impatti negativi sulla qualità audio dei files ottenuti. Come si può facilmente notare, il tipo di compressione scelta ha impatti rilevanti sulle dimensioni complessive dei files MP3 ottenuti, e di conseguenza sulla quantità di memoria occupata. Utilizzare un fattore di compressione più elevato ha, quale logica conseguenza, la perdita di qualità audio del file ottenuto; il miglior compromesso, per un impiego generico quale quello di Rio, è di adottare un bitrate di 128kbps, eventualmente inferiore (fino al limite minimo di 64 kbps) se si desidera memorizzare un maggior quantitativo di files musicali e si accetta il compromesso di una qualità audio inferiore.

 
^