Formati lossy VS lossless: facciamo una prova SERIA

Diabolik.cub · 09-02-2007, 16:31

Salve a tutti, spesso leggo che l'mp3 fa schifo a prescindere e non c'è paragone tra un cd e un file compresso. Possiamo essere d'accordo o meno, ma secondo me non c'è niente di meglio di una prova pratica per sfatare i miti e testare come il nostro orecchio percepisce le differenze.

Ecco come fare:

Prendiamo il nostro cd preferito che conosciamo alla perfezione, selezioniamo una traccia e rippiamola sul pc rigorosamente in formato non compresso wav. Per l'operazione consiglio di usare EAC.

A quanto punto ci serve un programma che consenta di comprimere il wav e comparare i due files. Chi meglio di foobar2000 è idoneo per questo?

Fate l'installazione completa e lanciate il player. Aprite il wav da foobar e cliccate con il destro -> convert -> to same directory

Si aprirà un menù a tendina, come prima prova selezionate LAME (MP3) con il preset -V 2 (192 kbps vbr).

Non resta che importare il file dentro foobar: ora nella playlist ci sarà sia il wav che l'mp3. Selezionateli entrambi, di nuovo click con il destro -> Utils -> ABX Two tracks..
Comparirà questa simpatica schermata:

Come vede è molto intuitivo. Consiglio di selezionare hide results per non farsi condizionare, e fare la comparativa su spezzoni di 30 secondi, usando set start/end e spostando il cursore quando siete in pausa. Il meccanismo è molto semplice: cliccate su play A e su play B. Uno è il file wav e l'altro è l'mp3. Dovete scoprire quale di questi corrisponde a X, e quale a Y. Quando siete sicuri, selezionate una delle due opzioni in Choice. Selezionate i 30 secondi successivi della canzone, fino a quando arrivate alla fine. Una volta terminata, vi salverà un report in txt.

Tutto quello che vi chiedo è di postare qui sul forum il risultato, indicando la vostra configurazione (scheda audio e diffusori) e il titolo del brano usato.

Magari prima iniziate con un brano pop/rock/commerciale, senza andare subito su musica classica/jazz dove è molto più facile scoprire le differenze

narnonet · 09-02-2007, 16:57

bello bello...

adesso mi armo di tutto punto dei software che servono e poi provo.

Ciao

narnonet · 09-02-2007, 17:00

ma perchè proprio a 192Kbps vbr?

io tutti gli MP3, anche quelli che metto nel lettore MP3 portatile li comprimo a 320Kbps.

Ciao

Diabolik.cub · 09-02-2007, 18:07

ovviamente più è basso il bitrate, maggiore è la compressione e la differenza con l'originale. Ho proposto come base di partenza il preset -V 2 che corrisponde a un bitrate medio, né troppo alto né troppo basso. In base alle capacità di ognuno e magari al genere musicale del file rippato, è possibile salire o scendere di bitrate fino a trovare la soglia di rilevamento differenze.

Questo test può anche essere utile anche per decidere con quale compressione salvare i files da usare in lettore mp3. Tu ad esempio comprimi mp3 a 320 kbps. Potresti salvare lo stesso file (sempre partendo dal wav mi raccomando!!) a diversi bitrate (96, 128, 192) e fare il test. Se scoprissi ad esempio che non rilevi differenze tra i file a 192 e 320 potresti salvare tutto a 192 salvando un bel di spazio sul lettore senza perdere niente come ascolto

narnonet · 09-02-2007, 18:10

si questo lo avevo capito dei bitrate differenti...

non riuscivo a capire solo come mai avevi preso 192 come dato di partenza... ora ho capito tutto

Ciao

Fabio70rm · 09-02-2007, 18:50

Penso che prima di tutto bisognerebbe stabilire anche dove vengono ascoltati i file audio.

Una prova in ascolto con casse da 2 watt o con coni da 5 cm di diametro non ha molto senso...così come un ascolto sugli steretti da supermercato tutto in uno a venti euro...

Almeno casse da impianto stereo buone.

Fabio70rm · 09-02-2007, 18:52

Quote:

Originariamente inviato da Diabolik.cub

Salve a tutti, spesso leggo che l'mp3 fa schifo a prescindere e non c'è paragone tra un cd e un file compresso.

Non è che sia poi un'opinione...è la realtà.

Il motivo risiede nell'acustica e nel trattamento digitale delle informazioni audio.

Appena ho tempo spiego il motivo. E cominciamo a sfatare un bel po' di miti...

albasnake · 09-02-2007, 21:38

Presa dall'ALTRO THREAD

Quote:

Originariamente inviato da Fabio70rm

Vedo che in tanti NON conoscono nè il teorema di Nyquist nè COME si fa un campionamento.

Ho letto tante stupidaggini.

La più eclatante è che il 44.100 è perchè il limite umano di ascolto è 20.000 ed essendo l'ascolto stereo si fa 20.000 X 2 più una piccola ridondanza...
(cut)

Senza che mi vado a cercare i vecchi appunti, io ricordavo proprio questo sulla scelta della frequenza di campionamento, ho un dubbio sulla causa del 2x, ti chiedo perchè 44.100?

Comunque IMHO dire che "l'mp3 fa schifo a prescindere" mi sembra un po' eccessivo, credo che solo una piccola percentuale di noi possa apprrezzare la superiorità di un wav rispetto a un mp3 ben fatto a 320kbps, io con i miei mezzi sicuramente no.

Diabolik.cub · 10-02-2007, 09:03

Innanzitutto, grazie per aver accolto il mio invito a proseguire qui la discussione.

Quote:

Originariamente inviato da Fabio70rm

Penso che prima di tutto bisognerebbe stabilire anche dove vengono ascoltati i file audio.

Una prova in ascolto con casse da 2 watt o con coni da 5 cm di diametro non ha molto senso...così come un ascolto sugli steretti da supermercato tutto in uno a venti euro...

Almeno casse da impianto stereo buone.
...
Non è che sia poi un'opinione...è la realtà.

Il motivo risiede nell'acustica e nel trattamento digitale delle informazioni audio.

Per quanto riguarda la qualità marcatamente inferiore dei formati lossy, nessuno qui vuole dimostrare che non è così, ma penso che sia ancora più interessante misurare queste differenze all'atto pratico!

Quindi chiedo, a chi ha voglia, di lanciarsi in questa prova per verificare quanto incide una compressione lossy e a che bitrate. Il risultato non sarà una legge fisica imprescindibile, ma un puro dato statistico ai fine di un'indagine tra noi. Giusto per dire "l'utente x con l'impianto y da n euro inizia a percepire differenze sul brano z a partire dal bitrate m", ok?

Per me è sbagliato condannare a priori gli mp3/aac, ci sono molti contesti in cui sono più che adeguati, a seconda del genere musicale/impianto del fruitore.

E cmq non vi va di mettervi alla prova e vedere quanto avete l'orecchio fine? Non ho ancora visto neanche un log

Fabio70rm · 10-02-2007, 11:15

Dunque visto che sul thread delle schede audio ho visto scrivere tante stupidaggini (perdonatemi ma è proprio così), sono costretto a fare una piccola lezioncina (Dio solo sa se odio queste cose!) perchè mi pare che tanta gente abbia le idee un po' confuse su come funziona il campionamento digitale.

In natura un suono od un rumore è composto da onde di pressione acustica, generalmente chiamate onde sonore; queste onde sonore risuonano in uno spettro di frequenze che sono teoricamente infinite. Teoricamente perchè, essendo il prodotto di oggetti che vibrano, ci sarà un limite di vibrazione inferiore dato dallo stato di quiete ed un limite superiore dato dal coefficiente chimico di rottura dell'oggetto (parliamo per ora degli oggetti solidi). Quindi il suono è un fenomeno fisico quasi infinito che viene percepito in maniera non lineare. Che vuol dire quasi infinito?
Per via del teorema di Fourier, un fenomeno ondulatorio periodico, come ad esempio il suono, può essere rappresentato per mezzo della cosiddetta serie di Fourier:

a + (sommatoria di k che va da 0 a + infinito) (b* (cos (ka) + sen (ka))

a è chiamata fondamentale e le sommatorie del polinomio armonici; questo per quanto riguarda i suoni puri. Per i suoni impuri o rumori il discorso è più complesso, per ora trascuriamolo.

Quindi avremo una forma d'onda che è composta più o meno così:

Tra i due limiti estremi l'oggetto quindi vibrerà in maniera infinita, dato che tra due linee di armonici ci sarà sempre un armonico tra di essi compreso.

Propagandosi in un mezzo elastico (generalmente l'aria), le onde sonore arrivano al nostro orecchio; questi ha un range di sensibilità che va grossomodo dai 20 ai 20.000 Hz e in quest range capta onde sonore in maniera non lineare e le trasmette al nostro cervello.

Anzitutto che significa non lineare? Non lineare significa che noi non percepiamo tutte le frequenze alla stessa intensità, ma alcune le sentiamo di più altre di meno.
Uno scienziato, Fletcher fece delle misurazioni su un campione di circa mille persone e trovò che l'ascolto medio dell'orecchio umano è il seguente:

In ascissa (linea orizzontale) abbiamo le frequenze, in ordinata (linea verticale) abbiamo la potenza in decibel. Come si vede le frequenze basse sono scarsamente percepibili dall'orecchio, e servono potenze abbastanza elevate (sui 70 db) per poter essere apprezzate; di contro sulle frequenze acute l'orecchio è molto sensibile. Quindi possiamo capire da questo grafico che l'esposizione a frequenze medio alte a volumi eccessivi è molto più dannoso dell'esposizione a frequenze basse. Piccolo OT notate il massimo picco di sensibilità nei pressi dei 3500 Hz, che è esattamente la frequenza del pianto di un neonato.

Ora questo avviene in natura.

Nel campo del digitale come viene riprodotto?

Anzitutto, essendo il digitale una funzione discreta, non può rappresentare tutti i valori degli armonici, ma avrà una approssimazione; come avviene quindi la digitalizzazione di un suono?

Anzitutto si passa per un passaggio fondamentale che si chiama conversione analogico digitale; questa avviene in questo modo:

Nel primo grafico in alto abbiamo il nostro segnale analogico. Nei grafici successivi, ad intervalli di tempo, il campionatore va a misurare (linee verticali sul grafico) il valore del segnale analogico; creerà quindi una tabella con indicati i valori numerici del segnale ad x tempo. Maggiori sono le volte che si effettuano le misurazioni, migliore sarà la ricostruzione del segnale, perchè i valori sono più vicini tra loro. Difatti man mano che la frequenza di campionamento aumenta migliora l'accuratezza della ricostruzione sonora.
Quindi cos'è la frequenza di campionamento? E' il numero di volte che il campionatore misura il segnale analogico. Quindi una frequenza di campionamento infinita riprodurrebbe esattamente il fenomeno analogico. E' chiaro però che questo non è possibile perchè dovrei avere immagazzinamento infinito (i numeri li memorizzo in un mezzo fisico, come un un buffer o una ram) e perchè ci sono dei limiti di calcolo (i numeri reali non sono tutti finiti, pensiamo ad un armonico tipo 160,36788468619846...etc. di Hz), quindi per forza di cose avremo un segnale approssimato.
Ora però non abbiamo considerato che anche il segnale analogico ha una sua frequenza; abbiamo visto prima che le frequenze utili per l'orecchio vanno da 20 a 20.000 hz. Quindi: qual'è la frequenza minima utile che mi permette di campionare con sufficiente sicurezza l'intera gamma sonora percepita dall'orecchio? Il Teorema di Nyquist afferma che data una frequenza da campionare, la frequenza di campionamento dev'essere maggiore od uguale al doppio della frequenza da campionare. Quindi se il limite umano è 20.000, la frequenza minima accettabile è 40.000 Hz. E siccome dobbiamo tenere conto delle tolleranze, degli errori di calcolo e di svariati fattori, il limite minimo si considera su una frequenza di 44.100 Hz. Ecco quindi da dove deriva realmente lo standard 44.100!

Domanda: e cosa sono i bit? Si sente parlare spesso di 16, 24 e 32 bit...

I bit sono le grandezze possibili in misurazione: ossia più bit ho maggiore è la gamma dinamica che posso esprimere.

In parole povere: la frequenza di campionamento riproduce la linea in orizzontale, i bit di campionamento riproducono i db in verticale. Un segnale a 16 bit ha dinamica minore di uno a 32 bit.

Ed ora uno sguardo ad un file audio compresso.

I dati contenuti in un file audio sono tutti valori delle frequenze e delle dinamiche; se devo ridurre la dimensione di questo file, necessariamente devo tagliare o ridurre qualcosa. Però quello che taglio non sono dati ricostruibili, perchè l'algoritmo di compressione fa un'operazione di questo tipo.

Supponiamo di avere una tabella di valori audio e dinamiche come la seguente:

Frequenza-----------------------------------
20 46 108 54 103 13 25 220
Dinamica-------------------------------------
76 44 98 55 113 11 37 440

Tempo --------------------------------------
1 2 3 4 5 6 7 8

Quindi a tempo 1 avremo la frequenza 20 a 76 db, a tempo due la frequenza 146 a 44 db etc.

Gli studi di psicoacustica hanno permesso di accertare che l'uomo non è sensibile nello stesso modo a tutte le frequenze e che un suono ad alta intensità ne maschera uno con frequenza vicina ma intensità più bassa. Sfruttando queste ed altre considerazioni, si può pensare di eliminare l'informazione che non verrebbe comunque percepita ed ottenere quindi un buon rapporto di compressione. Cioè nella tabella precedente io "taglio" i valori maggiori che mi occupano più spazio (103, 220 e 108 in digitale sono molto onerosi da scrivere - ricordo che le scritture sono in binario) e li approssimo con frequenze che, tramite il mascheramento psicoacustico, me le "ricordano". Le ricordano ma non sono quelle originali. Ed è una bella differenza!
In un file audio inoltre le informazioni sono contenute in numeri binari; nella nostra tabella di esempio abbiamo visto che ad un secondo corrisponde un solo valore di frequenza, ma sappiamo che in un secondo di un brano musicale ci sono molto più di una frequenza suonata: pensate ad una scala di un chitarrista ad esempio! Quindi ad ogni secondo c'è un certo numero di bit che contiene le informazioni sulle frequenze ed intensità. Questo numero di cifre binarie è detto bitrate. In altre parole il bitrate è il numero di cifre binarie impiegate per immagazzinare un secondo di informazione. Questo può essere costante per tutta la durata del file o variare all'interno di esso. Ad esempio i cd musicali vengono campionati (registrati) ad una frequenza pari a 44.100Hz. Da ciò si evince che ogni secondo si hanno 44.100 valori registrati dall'ipotetico microfono che vanno poi moltiplicati per i 2 canali del suono stereo che vanno a loro volta moltiplicati per 2 poiché la registrazione avviene a 16 bit (pari appunto a 2 byte). Quindi avremo:

44.100 x 2 x 2 x 60 (secondi) = ~10 MB ogni minuto

La compressione, diminuendo la lunghezza globale del file, diminuirà di conseguenza il bitrate medio. Il bitrate medio diventa dunque in questi casi l'indice dell'entità della compressione. Ad esempio se il file di origine possedesse un bitrate di 1411 Kbit/s - ognuno dei quali ricordo è un valore di frequenza e dinamica -e il file compresso possedesse un bitrate medio di 320 Kbit/s, allora avremmo ridotto di un fattore pari a circa 4,5. Il che significa che delle frequenze originarie del file audio non compresso ne conservo una ogni 4,5. Il resto è "ricostruito" dal mascheramento...

Ecco quindi che un file audio compresso ha minor capienza in termini di kb, ma ha anche minore accuratezza, frequenze tagliate e ricostruite molto approssimativamente...

Esistono inoltre due tipi di compressione: cosiddetta senza perdita e con perdita.

Usando un algoritmo di compressione senza perdita, dal risultato della compressione si può riottenere tutta l'informazione originaria. In questo caso la riduzione massima generalmente ottenibile, utilizzando algoritmi studiati appositamente per l'audio è all'incirca del 60%, ma solo con alcuni tipi di suono. Si possono utilizzare gli stessi algoritmi generali di compressione (come per esempio ZIP o Gzip) ma i risultati in termine di riduzione sono inferiori.

Esempio: FLAC, APE, ALE

Negli algoritmi di compressione compressione audio con perdita non si può più ottenere un suono identico all'originale ma la riduzione ottenibile è molto spinta: con rapporti di compressione di 10 a 1, il risultato è quasi indistinguibile dall'originale ma ci si può spingere anche oltre a discapito della qualità.

Spero di aver chiarito abbondantemente l'aspetto fisico ed informatico del problema!

Diabolik.cub · 10-02-2007, 11:55

grazie per la spiegazione esauriente, un ripasso fa sempre bene

Piccola precisazione per la scelta della Fc

Quote:

Originariamente inviato da Università di Pisa

44100Hz/16bit. È il formato del CD Audio, dà una banda passante di circa 20KHz con circa 96dB di dinamica. Forse non tutti sanno perché è stato scelto proprio 44100. Le prime apparecchiature di registrazione digitale erano basate su registratori video; per ovvi motivi di semplicità di progetto era bene avere un numero intero di campioni per ogni linea di quadro.
Il formato NTSC usa 30 frame di 525 linee al secondo (di cui 490 utilizzabili); con 3 campioni per linea si ottiene una Fc di 30x490x3=44100.
D’altra parte il formato PAL/SECAM usa 25 frame di 625 linee al secondo (di cui 588 utilizzabili); con 3 campioni per linea si ottiene una Fc di 25x588x3=44100, semplice no?

Una cosa non ho mai capito.. il segnale analogico originale è rappresentabile nel dominio del tempo da una linea continua.. ma cosa mi rappresenta quella linea?! Se c'è solo una voce che parla, ci sono un tot di frequenze coinvolte, se invece prendiamo un'orchestra quasi avremo onde sonore in quasi tutto lo spettro udibile, giusto? Come fanno tutte queste onde diverse ad essere rappresentate con una singola linea?

wisher · 10-02-2007, 12:02

Quote:

Originariamente inviato da Diabolik.cub

grazie per la spiegazione esauriente, un ripasso fa sempre bene

Una cosa non ho mai capito.. il segnale analogico originale è rappresentabile nel dominio del tempo da una linea continua.. ma cosa mi rappresenta quella linea?! Se c'è solo una voce che parla, ci sono un tot di frequenze coinvolte, se invece prendiamo un'orchestra quasi avremo onde sonore in quasi tutto lo spettro udibile, giusto? Come fanno tutte queste onde diverse ad essere rappresentate con una singola linea?

E' una sola linea data dalla somma delle singole componenti

**sacd** · 10-02-2007, 12:07

http://www.hwupgrade.it/forum/showth...&page=10&pp=40

Ma nn c'era questa discussione?

Diabolik.cub · 10-02-2007, 12:19

Quote:

Originariamente inviato da wisher

E' una sola linea data dalla somma delle singole componenti

Ma non c'è il rischio che la somma di componenti diverse dia lo stesso risultato? ad esempio nel primo caso ho 1+6=7, nel secondo 3+4=7 come prima ma le onde sono diverse. Inoltre qui si parla di campioni al secondo, ma vuole dire che c'è un campione che rimane fisso per 1/44100 = 22 micro secondi?

Quote:

Originariamente inviato da sacd

http://www.hwupgrade.it/forum/showth...&page=10&pp=40
Ma nn c'era questa discussione?

Hai ragione, ma quella mi sembrava più orientata a trovare il miglior formato lossy, più che evidenziare differenze tra lossless - lossy.
Ho creato questa discussione per ridurre un po' gli OT nel thread sulla scelta scheda audio e soprattutto per proporre questo semplice test che nessuno ha ancora fatto..
Dai sacd inizia tu che hai sicuramente un super impianto rivelatore

Fabio70rm · 10-02-2007, 13:17

Quote:

Originariamente inviato da Diabolik.cub

grazie per la spiegazione esauriente, un ripasso fa sempre bene

Piccola precisazione per la scelta della Fc

Una cosa non ho mai capito.. il segnale analogico originale è rappresentabile nel dominio del tempo da una linea continua.. ma cosa mi rappresenta quella linea?! Se c'è solo una voce che parla, ci sono un tot di frequenze coinvolte, se invece prendiamo un'orchestra quasi avremo onde sonore in quasi tutto lo spettro udibile, giusto? Come fanno tutte queste onde diverse ad essere rappresentate con una singola linea?

E' opinione comune ed errata che il formato CD sia stato introdotto come derivazione dall'audio broadcast per il video.
Non è così. E' semplicemente il miglior rapporto di qualità "commerciale" ottenibile.
Il grafico è un esempio, chiaro che una voce o uno strumento hanno un andamento stratigrafico. Sostituisci alla linea di esempio lo strato di frequenze di un qualsiasi suono il risultato è lo stesso.

Diabolik.cub · 10-02-2007, 13:35

cosa intendi per stratigrafico? Quindi i 44100 oltre ad essere divisi per il tempo vanno anche suddivisi per i vari "strati di frequenza"? Quanti sono indicativamente?

Un grafico di questo strato di frequenze farebbe comodo per capire meglio

**sacd** · 10-02-2007, 15:54

http://groups.google.it/group/it.com...0109b09faa0ce9

http://www.lithium.it/articolo0012p1.htm

http://www.nemesi.net/audio2.htm

http://www.di.unipi.it/~romani/IAD/IAD4.pdf

simon71 · 11-02-2007, 08:31

Ragazzi, iniziamo a parlare di cose empiriche...Prove?

Io sto convertendo alcuni Cd "minori" in AAC, la versione di ITUNES 7.02 e devo dire che i risultati sono + che soddisfacenti. Ho ottenuto ottimi risultati con Joe Jackson, specie Night And Day inciso nel 1982 in modo maniacale ai Rudy Van Gleder Studios di New York e rimasterizzato meglio...un Cd con Dinamica e aria da vendere...anche se rimastereizzato in 44.100 e 16 bit.....
Non ci dimentichiamo l'incisione originale che alla fine è il vero Cucuzzolo della montagna della riproduzione sonora...al di là delle digitalizzazioni più o meno valide... Provate ad ascoltare un Schubert o un Ludovico Van della Deutsche o della Decca....beh...non c'è paragone IMHO a favore di quest'ultima

Fabio70rm · 11-02-2007, 09:59

Quote:

Originariamente inviato da Diabolik.cub

cosa intendi per stratigrafico? Quindi i 44100 oltre ad essere divisi per il tempo vanno anche suddivisi per i vari "strati di frequenza"? Quanti sono indicativamente?

Un grafico di questo strato di frequenze farebbe comodo per capire meglio

Penso che i link citati da SACD (grazie a proposito!) siano più che esaurienti.

Fabio70rm · 11-02-2007, 10:06

Quote:

Originariamente inviato da simon71

Ragazzi, iniziamo a parlare di cose empiriche...Prove?

Io sto convertendo alcuni Cd "minori" in AAC, la versione di ITUNES 7.02 e devo dire che i risultati sono + che soddisfacenti. Ho ottenuto ottimi risultati con Joe Jackson, specie Night And Day inciso nel 1982 in modo maniacale ai Rudy Van Gleder Studios di New York e rimasterizzato meglio...un Cd con Dinamica e aria da vendere...anche se rimastereizzato in 44.100 e 16 bit.....
Non ci dimentichiamo l'incisione originale che alla fine è il vero Cucuzzolo della montagna della riproduzione sonora...al di là delle digitalizzazioni più o meno valide... Provate ad ascoltare un Schubert o un Ludovico Van della Deutsche o della Decca....beh...non c'è paragone IMHO a favore di quest'ultima

Vedi credo tu stia confondendo con l'incisione in digitale con la remasterizzazione.

Il primo processo passa per una consolle analogica che campiona dai microfoni, converte con i propri convertitori o con convertitori serie Madi o Apogee e passa al banco effetti e da qui al pc. Il risultato è un file audio campionato in genere a 48 Khz 24 bit (ormai parecchi studi di registrazione lavorano così) ed elaborato all'interno di software quale Nuendo, Cubase, Sonar, Performer e Protools (Logic se si ha solo Apple). Dopodichè si fa il mastering a formato CD (16 bit 44.100 Hz) con convertitori professionali e filtri anti dithering e si imprime il master, con CD writer professionali.

Se invece si prende del materiale audio vecchio si può tentare un restauro e successiva masterizzazione in digitale, ma molto dipende da che tipo di audio. Un mio collega stava lavorando tempo addietro all'audio del film Pepe le Moko, degli anni 30. Audio mono, ipersupercompresso, estrapolato da nastro magnetico pieno di rumori e in pessimo stadio di conservazione. Ci puoi fare poco o niente. Ed in quel caso la digitalizzazione più di tanto non migliora la cosa, anzi, semmai ti esalta i lati peggiori dell'audio.

09-02-2007, 16:31	#1
Diabolik.cub Senior Member Iscritto dal: Apr 2001 Città: Torino (provincia) Messaggi: 960	Formati lossy VS lossless: facciamo una prova SERIA Salve a tutti, spesso leggo che l'mp3 fa schifo a prescindere e non c'è paragone tra un cd e un file compresso. Possiamo essere d'accordo o meno, ma secondo me non c'è niente di meglio di una prova pratica per sfatare i miti e testare come il nostro orecchio percepisce le differenze. Ecco come fare: Prendiamo il nostro cd preferito che conosciamo alla perfezione, selezioniamo una traccia e rippiamola sul pc rigorosamente in formato non compresso wav. Per l'operazione consiglio di usare EAC. A quanto punto ci serve un programma che consenta di comprimere il wav e comparare i due files. Chi meglio di foobar2000 è idoneo per questo? Fate l'installazione completa e lanciate il player. Aprite il wav da foobar e cliccate con il destro -> convert -> to same directory Si aprirà un menù a tendina, come prima prova selezionate LAME (MP3) con il preset -V 2 (192 kbps vbr). Non resta che importare il file dentro foobar: ora nella playlist ci sarà sia il wav che l'mp3. Selezionateli entrambi, di nuovo click con il destro -> Utils -> ABX Two tracks.. Comparirà questa simpatica schermata: Come vede è molto intuitivo. Consiglio di selezionare hide results per non farsi condizionare, e fare la comparativa su spezzoni di 30 secondi, usando set start/end e spostando il cursore quando siete in pausa. Il meccanismo è molto semplice: cliccate su play A e su play B. Uno è il file wav e l'altro è l'mp3. Dovete scoprire quale di questi corrisponde a X, e quale a Y. Quando siete sicuri, selezionate una delle due opzioni in Choice. Selezionate i 30 secondi successivi della canzone, fino a quando arrivate alla fine. Una volta terminata, vi salverà un report in txt. Tutto quello che vi chiedo è di postare qui sul forum il risultato, indicando la vostra configurazione (scheda audio e diffusori) e il titolo del brano usato. Magari prima iniziate con un brano pop/rock/commerciale, senza andare subito su musica classica/jazz dove è molto più facile scoprire le differenze __________________ Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy.

09-02-2007, 16:57	#2
narnonet Senior Member Iscritto dal: Feb 2003 Città: 134340 Pluto - [VL] Messaggi: 8520	bello bello... adesso mi armo di tutto punto dei software che servono e poi provo. Ciao __________________ D'OH!

09-02-2007, 17:00	#3
narnonet Senior Member Iscritto dal: Feb 2003 Città: 134340 Pluto - [VL] Messaggi: 8520	ma perchè proprio a 192Kbps vbr? io tutti gli MP3, anche quelli che metto nel lettore MP3 portatile li comprimo a 320Kbps. Ciao __________________ D'OH!

09-02-2007, 18:07	#4
Diabolik.cub Senior Member Iscritto dal: Apr 2001 Città: Torino (provincia) Messaggi: 960	ovviamente più è basso il bitrate, maggiore è la compressione e la differenza con l'originale. Ho proposto come base di partenza il preset -V 2 che corrisponde a un bitrate medio, né troppo alto né troppo basso. In base alle capacità di ognuno e magari al genere musicale del file rippato, è possibile salire o scendere di bitrate fino a trovare la soglia di rilevamento differenze. Questo test può anche essere utile anche per decidere con quale compressione salvare i files da usare in lettore mp3. Tu ad esempio comprimi mp3 a 320 kbps. Potresti salvare lo stesso file (sempre partendo dal wav mi raccomando!!) a diversi bitrate (96, 128, 192) e fare il test. Se scoprissi ad esempio che non rilevi differenze tra i file a 192 e 320 potresti salvare tutto a 192 salvando un bel di spazio sul lettore senza perdere niente come ascolto __________________ Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy.

09-02-2007, 18:10	#5
narnonet Senior Member Iscritto dal: Feb 2003 Città: 134340 Pluto - [VL] Messaggi: 8520	si questo lo avevo capito dei bitrate differenti... non riuscivo a capire solo come mai avevi preso 192 come dato di partenza... ora ho capito tutto Ciao __________________ D'OH!

09-02-2007, 18:50	#6
Fabio70rm Senior Member Iscritto dal: Jun 2006 Città: Roma Messaggi: 1768	Penso che prima di tutto bisognerebbe stabilire anche dove vengono ascoltati i file audio. Una prova in ascolto con casse da 2 watt o con coni da 5 cm di diametro non ha molto senso...così come un ascolto sugli steretti da supermercato tutto in uno a venti euro... Almeno casse da impianto stereo buone.

10-02-2007, 11:15	#10
Fabio70rm Senior Member Iscritto dal: Jun 2006 Città: Roma Messaggi: 1768	Dunque visto che sul thread delle schede audio ho visto scrivere tante stupidaggini (perdonatemi ma è proprio così), sono costretto a fare una piccola lezioncina (Dio solo sa se odio queste cose!) perchè mi pare che tanta gente abbia le idee un po' confuse su come funziona il campionamento digitale. In natura un suono od un rumore è composto da onde di pressione acustica, generalmente chiamate onde sonore; queste onde sonore risuonano in uno spettro di frequenze che sono teoricamente infinite. Teoricamente perchè, essendo il prodotto di oggetti che vibrano, ci sarà un limite di vibrazione inferiore dato dallo stato di quiete ed un limite superiore dato dal coefficiente chimico di rottura dell'oggetto (parliamo per ora degli oggetti solidi). Quindi il suono è un fenomeno fisico quasi infinito che viene percepito in maniera non lineare. Che vuol dire quasi infinito? Per via del teorema di Fourier, un fenomeno ondulatorio periodico, come ad esempio il suono, può essere rappresentato per mezzo della cosiddetta serie di Fourier: a + (sommatoria di k che va da 0 a + infinito) (b* (cos (ka) + sen (ka)) a è chiamata fondamentale e le sommatorie del polinomio armonici; questo per quanto riguarda i suoni puri. Per i suoni impuri o rumori il discorso è più complesso, per ora trascuriamolo. Quindi avremo una forma d'onda che è composta più o meno così: Tra i due limiti estremi l'oggetto quindi vibrerà in maniera infinita, dato che tra due linee di armonici ci sarà sempre un armonico tra di essi compreso. Propagandosi in un mezzo elastico (generalmente l'aria), le onde sonore arrivano al nostro orecchio; questi ha un range di sensibilità che va grossomodo dai 20 ai 20.000 Hz e in quest range capta onde sonore in maniera non lineare e le trasmette al nostro cervello. Anzitutto che significa non lineare? Non lineare significa che noi non percepiamo tutte le frequenze alla stessa intensità, ma alcune le sentiamo di più altre di meno. Uno scienziato, Fletcher fece delle misurazioni su un campione di circa mille persone e trovò che l'ascolto medio dell'orecchio umano è il seguente: In ascissa (linea orizzontale) abbiamo le frequenze, in ordinata (linea verticale) abbiamo la potenza in decibel. Come si vede le frequenze basse sono scarsamente percepibili dall'orecchio, e servono potenze abbastanza elevate (sui 70 db) per poter essere apprezzate; di contro sulle frequenze acute l'orecchio è molto sensibile. Quindi possiamo capire da questo grafico che l'esposizione a frequenze medio alte a volumi eccessivi è molto più dannoso dell'esposizione a frequenze basse. Piccolo OT notate il massimo picco di sensibilità nei pressi dei 3500 Hz, che è esattamente la frequenza del pianto di un neonato. Ora questo avviene in natura. Nel campo del digitale come viene riprodotto? Anzitutto, essendo il digitale una funzione discreta, non può rappresentare tutti i valori degli armonici, ma avrà una approssimazione; come avviene quindi la digitalizzazione di un suono? Anzitutto si passa per un passaggio fondamentale che si chiama conversione analogico digitale; questa avviene in questo modo: Nel primo grafico in alto abbiamo il nostro segnale analogico. Nei grafici successivi, ad intervalli di tempo, il campionatore va a misurare (linee verticali sul grafico) il valore del segnale analogico; creerà quindi una tabella con indicati i valori numerici del segnale ad x tempo. Maggiori sono le volte che si effettuano le misurazioni, migliore sarà la ricostruzione del segnale, perchè i valori sono più vicini tra loro. Difatti man mano che la frequenza di campionamento aumenta migliora l'accuratezza della ricostruzione sonora. Quindi cos'è la frequenza di campionamento? E' il numero di volte che il campionatore misura il segnale analogico. Quindi una frequenza di campionamento infinita riprodurrebbe esattamente il fenomeno analogico. E' chiaro però che questo non è possibile perchè dovrei avere immagazzinamento infinito (i numeri li memorizzo in un mezzo fisico, come un un buffer o una ram) e perchè ci sono dei limiti di calcolo (i numeri reali non sono tutti finiti, pensiamo ad un armonico tipo 160,36788468619846...etc. di Hz), quindi per forza di cose avremo un segnale approssimato. Ora però non abbiamo considerato che anche il segnale analogico ha una sua frequenza; abbiamo visto prima che le frequenze utili per l'orecchio vanno da 20 a 20.000 hz. Quindi: qual'è la frequenza minima utile che mi permette di campionare con sufficiente sicurezza l'intera gamma sonora percepita dall'orecchio? Il Teorema di Nyquist afferma che data una frequenza da campionare, la frequenza di campionamento dev'essere maggiore od uguale al doppio della frequenza da campionare. Quindi se il limite umano è 20.000, la frequenza minima accettabile è 40.000 Hz. E siccome dobbiamo tenere conto delle tolleranze, degli errori di calcolo e di svariati fattori, il limite minimo si considera su una frequenza di 44.100 Hz. Ecco quindi da dove deriva realmente lo standard 44.100! Domanda: e cosa sono i bit? Si sente parlare spesso di 16, 24 e 32 bit... I bit sono le grandezze possibili in misurazione: ossia più bit ho maggiore è la gamma dinamica che posso esprimere. In parole povere: la frequenza di campionamento riproduce la linea in orizzontale, i bit di campionamento riproducono i db in verticale. Un segnale a 16 bit ha dinamica minore di uno a 32 bit. Ed ora uno sguardo ad un file audio compresso. I dati contenuti in un file audio sono tutti valori delle frequenze e delle dinamiche; se devo ridurre la dimensione di questo file, necessariamente devo tagliare o ridurre qualcosa. Però quello che taglio non sono dati ricostruibili, perchè l'algoritmo di compressione fa un'operazione di questo tipo. Supponiamo di avere una tabella di valori audio e dinamiche come la seguente: Frequenza----------------------------------- 20 46 108 54 103 13 25 220 Dinamica------------------------------------- 76 44 98 55 113 11 37 440 Tempo -------------------------------------- 1 2 3 4 5 6 7 8 Quindi a tempo 1 avremo la frequenza 20 a 76 db, a tempo due la frequenza 146 a 44 db etc. Gli studi di psicoacustica hanno permesso di accertare che l'uomo non è sensibile nello stesso modo a tutte le frequenze e che un suono ad alta intensità ne maschera uno con frequenza vicina ma intensità più bassa. Sfruttando queste ed altre considerazioni, si può pensare di eliminare l'informazione che non verrebbe comunque percepita ed ottenere quindi un buon rapporto di compressione. Cioè nella tabella precedente io "taglio" i valori maggiori che mi occupano più spazio (103, 220 e 108 in digitale sono molto onerosi da scrivere - ricordo che le scritture sono in binario) e li approssimo con frequenze che, tramite il mascheramento psicoacustico, me le "ricordano". Le ricordano ma non sono quelle originali. Ed è una bella differenza! In un file audio inoltre le informazioni sono contenute in numeri binari; nella nostra tabella di esempio abbiamo visto che ad un secondo corrisponde un solo valore di frequenza, ma sappiamo che in un secondo di un brano musicale ci sono molto più di una frequenza suonata: pensate ad una scala di un chitarrista ad esempio! Quindi ad ogni secondo c'è un certo numero di bit che contiene le informazioni sulle frequenze ed intensità. Questo numero di cifre binarie è detto bitrate. In altre parole il bitrate è il numero di cifre binarie impiegate per immagazzinare un secondo di informazione. Questo può essere costante per tutta la durata del file o variare all'interno di esso. Ad esempio i cd musicali vengono campionati (registrati) ad una frequenza pari a 44.100Hz. Da ciò si evince che ogni secondo si hanno 44.100 valori registrati dall'ipotetico microfono che vanno poi moltiplicati per i 2 canali del suono stereo che vanno a loro volta moltiplicati per 2 poiché la registrazione avviene a 16 bit (pari appunto a 2 byte). Quindi avremo: 44.100 x 2 x 2 x 60 (secondi) = ~10 MB ogni minuto La compressione, diminuendo la lunghezza globale del file, diminuirà di conseguenza il bitrate medio. Il bitrate medio diventa dunque in questi casi l'indice dell'entità della compressione. Ad esempio se il file di origine possedesse un bitrate di 1411 Kbit/s - ognuno dei quali ricordo è un valore di frequenza e dinamica -e il file compresso possedesse un bitrate medio di 320 Kbit/s, allora avremmo ridotto di un fattore pari a circa 4,5. Il che significa che delle frequenze originarie del file audio non compresso ne conservo una ogni 4,5. Il resto è "ricostruito" dal mascheramento... Ecco quindi che un file audio compresso ha minor capienza in termini di kb, ma ha anche minore accuratezza, frequenze tagliate e ricostruite molto approssimativamente... Esistono inoltre due tipi di compressione: cosiddetta senza perdita e con perdita. Usando un algoritmo di compressione senza perdita, dal risultato della compressione si può riottenere tutta l'informazione originaria. In questo caso la riduzione massima generalmente ottenibile, utilizzando algoritmi studiati appositamente per l'audio è all'incirca del 60%, ma solo con alcuni tipi di suono. Si possono utilizzare gli stessi algoritmi generali di compressione (come per esempio ZIP o Gzip) ma i risultati in termine di riduzione sono inferiori. Esempio: FLAC, APE, ALE Negli algoritmi di compressione compressione audio con perdita non si può più ottenere un suono identico all'originale ma la riduzione ottenibile è molto spinta: con rapporti di compressione di 10 a 1, il risultato è quasi indistinguibile dall'originale ma ci si può spingere anche oltre a discapito della qualità. Spero di aver chiarito abbondantemente l'aspetto fisico ed informatico del problema!

10-02-2007, 12:07	#13
sacd Moderatore Iscritto dal: Jun 2003 Città: MILANO Messaggi: 42143	http://www.hwupgrade.it/forum/showth...&page=10&pp=40 Ma nn c'era questa discussione? __________________ LianLi Pc-A05FN \| Gigabyte B450 AORUS PRO \| Amd Ryzen 5600X \| Schythe Mugen 5 Rev.b \| 2*8Gb DDR4 3200MHz \| RTX 4060 Ti \| BE QUIET! Straight Power 11 Platinum 550W \| Dell U2518D \| Logitech G602 \| Logitech MX Keys \| LG 55CX6LA \| Onkyo SE-200PCI \| Empire PS-2120D Modded \| My Hi-Fi \|

10-02-2007, 13:35	#16
Diabolik.cub Senior Member Iscritto dal: Apr 2001 Città: Torino (provincia) Messaggi: 960	cosa intendi per stratigrafico? Quindi i 44100 oltre ad essere divisi per il tempo vanno anche suddivisi per i vari "strati di frequenza"? Quanti sono indicativamente? Un grafico di questo strato di frequenze farebbe comodo per capire meglio __________________ Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy.

10-02-2007, 15:54	#17
sacd Moderatore Iscritto dal: Jun 2003 Città: MILANO Messaggi: 42143	http://groups.google.it/group/it.com...0109b09faa0ce9 http://www.lithium.it/articolo0012p1.htm http://www.nemesi.net/audio2.htm http://www.di.unipi.it/~romani/IAD/IAD4.pdf __________________ LianLi Pc-A05FN \| Gigabyte B450 AORUS PRO \| Amd Ryzen 5600X \| Schythe Mugen 5 Rev.b \| 2*8Gb DDR4 3200MHz \| RTX 4060 Ti \| BE QUIET! Straight Power 11 Platinum 550W \| Dell U2518D \| Logitech G602 \| Logitech MX Keys \| LG 55CX6LA \| Onkyo SE-200PCI \| Empire PS-2120D Modded \| My Hi-Fi \|

11-02-2007, 08:31	#18
simon71 Senior Member Iscritto dal: Dec 2004 Città: Milano Messaggi: 4631	Ragazzi, iniziamo a parlare di cose empiriche...Prove? Io sto convertendo alcuni Cd "minori" in AAC, la versione di ITUNES 7.02 e devo dire che i risultati sono + che soddisfacenti. Ho ottenuto ottimi risultati con Joe Jackson, specie Night And Day inciso nel 1982 in modo maniacale ai Rudy Van Gleder Studios di New York e rimasterizzato meglio...un Cd con Dinamica e aria da vendere...anche se rimastereizzato in 44.100 e 16 bit..... Non ci dimentichiamo l'incisione originale che alla fine è il vero Cucuzzolo della montagna della riproduzione sonora...al di là delle digitalizzazioni più o meno valide... Provate ad ascoltare un Schubert o un Ludovico Van della Deutsche o della Decca....beh...non c'è paragone IMHO a favore di quest'ultima __________________ MacBook Pro Early 2011, MacOs High Sierra- Apple Time Capsule 2Tb - iPhone 6s Plus Space Grey 128G

Strumenti
Mostra una versione stampabile Invia questa pagina per email