TRUST MP3 CYBERMAN

TRUST MP3 CYBERMAN

Analisi del lettore MP3 portatile Trust MP3 Cyberman; permette, tra le varie cose, di registrare sorgenti audio grazie al microfono incorporato.

di pubblicato il nel canale Multimedia
 

Mp3 - introduzione tecnica

Prima di soffermarci sull'analisi dell TRUST MP3 CYBERMAN, spendiamo due parole sul formato audio Mp3 e andiamo a riportare quanto già in precedenza scritto da Paolo nella prima recensione di un prodotto della stessa famiglia, il RIO di Diamond:

"L'evoluzione della rete ha portato all'introduzione di numerose novità anche dal punto di vista dell'audio: le contrastanti necessità di ridurre al minimo possibile l'occupazione di banda, cioè il quantitativo di dati trasmesso nella rete in un determinato periodo di tempo (ad esempio il secondo), e di ottenere una qualità di riproduzione audio la più possibile fedele (abituati come siamo all'elevata resa qualitativa dei supporti digitali), hanno portato allo studio di formati di compressione audio che rappresentassero un buon compromesso tra dimensioni (e quindi occupazione di banda in caso di trasmissione sulla rete) e qualità in riproduzione. L'MP3 è quello che, di fatto, è diventato lo standard per la diffusione di materiale audio sulla rete. Vedremo nel dettaglio che cosa sia questo standard, ma ora analizziamone le caratteristiche di base: l'MP3 permette di ottenere file audio di qualità paragonabile a quella di un Cd-Audio, con una occupazione dello spazio che può arrivare ad essere pari ad 1/12 di quella del corrispondente file audio in formato WAV. Facciamo un esempio pratico: il brano XYZ ha una durata di 5 minuti e 30 secondi; il corrispondente file WAV, ottenuto estraendo la traccia dal CD audio e salvandola sull'hard disk, ha dimensione di circa 58 Mbytes; convertendo questo file in formato MP3 a 128kbs si ottiene un file di dimensioni pari a 5.7 Mbytes . E' abbastanza immediato osservare come il trasferimento sulla rete di oltre 58 Mbytes sia decisamente più impegnativo, ed esigente in termini di banda, rispetto a quello di 5.7 Mbytes.
Analizziamo ora in maggior dettaglio lo standard MP3. Premessa indispensabile è la sigla MPEG, che sta per Motion Picture Experts Group e indica un gruppo di ricercatori che studia nuovi formati per la codifica e la riproduzione di audio e video; con questa sigla si indicano i diversi formati di compressione audio video nati da questo progetto. Il termine MP3 è in realtà un'abbreviazione di MPEG 1 – Layer 3, cioè del formato di compressione audio (Layer, per l'appunto) utilizzato nell'algoritmo MPEG 1. Riassumendo, pertanto, l'MPEG è una serie di algoritmi di compressione per la riproduzione audio-video; i Layer sono gli algoritmi di compressione utilizzati nella riproduzione MPEG per il solo audio; l'MPEG 1 – Layer 3, meglio noto come MP3, è uno degli algoritmi di compressione per l'audio utilizzati dall'algoritmo MPEG 1.

Quali sono i principi sui quali si basa la compressione del formato MP3? Si tratta di due:

  • principio delle frequenze non udibili: se vi sono sorgenti sonore poste vicino ad altre sorgenti sonore ma di intensità maggiore, le prime non saranno percepite dall'orecchio; con un esempio, se un usignolo canta accanto ad una automobile accesa, è pressoché impossibile che l'orecchio percepisca il canto dell'usignolo dato che ha una intensità sonora decisamente inferiore a quella del rombo del motore dell'automobile. Eliminare quella sorgente sonora significa rinunciare ad alcune informazioni audio che non sarebbero state comunque percepite dall'orecchio, ottenendo un file di dimensioni inferiori.

  • principio dei segnali meno importanti: all'interno dello spettro sonoro, cioè delle frequenze udibili dall'orecchio umano, esistono alcune frequenze che possono essere considerate meno importanti di altre per la fedeltà riproduttiva; togliendo queste la dimensione del file audio si riduce.

Durante la fase di compressione è possibile intervenire su tre tipi di variabili:

  1. tipo di canale: stereo e mono; il segnale stereo è più fedele ma porta ad un raddoppio delle dimensioni complesive rispetto a quello monofonico. E' possibile adottare un nuovo tipo di tecnologia, la Joint stereo, con la quale viene utilizzata la modalità mono quando questa non comporta una perdità di qualità del segnale audio (ad esempio, parlato, o sorgente sonora frontale), passando allo stereo non appena questo si renda necessario per mantenere la fedeltà della riproduzione.

  2. frequenza del campione o frequenza di campionamento: indica il numero di campioni, cioè di misurazioni prese dalla sorgente originaria, effettuate al secondo. A valori più elevati corrispondono più campioni al secondo, con una qualità riproduttiva superiore ma dimensioni proporzionalmente maggiori.

  3. dimensione del campione in bit: il segnale originario o sorgente è in forma analogica, pertanto di onda; la trasformazione di questo segnale in digitale prevede la fase di campionamento, cioè il segnale audio viene misurato ad intervalli di tempo prefissati (la frequenza di campionamento illustrata poco sopra indica esattamente la frequenza di queste rilevazioni); i valori ottenuti da questa misurazione possono essere più o meno precisi, e tale livello di precisione dei campioni è indicato dalla dimensione del campione in bit: a dimensioni superiori corrisponde una fedeltà del segnale audio superiore ma anche un file audio di dimensioni più elevate. 

intro_wave.gif (4660 byte)
Immagine presa da MP3News

Un CD audio contiene audio campionato a 44.100 Hz (cioè 44.100 volte al secondo), con campioni di ampiezza pari a 16 bit. L'immagine in alto a sinistra riproduce il segnale analogico, mentre quella a destra è lo stesso segnale ma convertito in digitale, a 44.100 Hz e 16 bit di profondità. Le due immagini sottostanti riproducono, rispettivamente, due dei possibili casi: frequenza di campionamento dimezzata a 22.000 Hz con profondità di 16 bit e frequenza di campionamento sempre a 44.100 Hz e profondità dei campioni di 8 bit; in entrambi i casi si ha una perduta di informazioni rispetto al segnale digitale a 44.100 Hz e 16 bit, ma quale vantaggio si ottengono dimensioni del file audio più ridotte.

A differenti frequenze di campionamento e profondità del campione, pertanto, sarà possibile ottenere files di dimensioni e qualità audio differenti. L'MPEG 1 – Layer 3 prevede frequenze di campionamento di 32, 44.1 e 48K, con ampiezze di banda comprese tra i 320 Kbps e i 32 Kbps.

Vediamo con un esempio pratico come il bitrate, cioè l'ampiezza di banda, vada a influenzare le dimensioni dei files MP3 ottenibili. A partire da un file wav di 50 Mbytes di dimensione, si possono ottenere i seguenti files MP3:

Bitrate Dimensioni Rapporto di compressione
(% della dimensione originaria)
320 kbps 11.637K 23.3%
256 Kbps 9.310K 18.62%
224 Kbps 8.146K 16.31%
192 Kbps 6.983K 13.96%
160 Kbps 5.819K 11.64%
128 Kbps 4.655K 9.31%
112 Kbps 4.073K 8.15%
96 Kbps 3.492K 6.98%
80 Kbps 2.910K 5.82%
64 Kbps 2.328K 4.65%
56 Kbps 2.037K 4.07%
48 Kbps 1.746K 3.49%
32 Kbps

1.164K

2.32%

L'output ottenuto è Stereo; è possibile ottenere files MP3 di dimensioni leggermente inferiori utilizzando le opzioni Joint Stereo e Bitrate Variable, anche se con impatti negativi sulla qualità audio dei files ottenuti. Come si può facilmente notare, il tipo di compressione scelta ha impatti rilevanti sulle dimensioni complessive dei files MP3 ottenuti, e di conseguenza sulla quantità di memoria occupata. Utilizzare un fattore di compressione più elevato ha, quale logica conseguenza, la perdita di qualità audio del file ottenuto; il miglior compromesso è di adottare un bitrate di 128kbps, eventualmente inferiore (fino al limite minimo di 64 kbps) se si desidera memorizzare un maggior quantitativo di files musicali e si accetta il compromesso di una qualità audio inferiore."

 
^