|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Apr 2001
Città: Torino (provincia)
Messaggi: 960
|
Formati lossy VS lossless: facciamo una prova SERIA
Salve a tutti, spesso leggo che l'mp3 fa schifo a prescindere e non c'è paragone tra un cd e un file compresso. Possiamo essere d'accordo o meno, ma secondo me non c'è niente di meglio di una prova pratica per sfatare i miti e testare come il nostro orecchio percepisce le differenze.
Ecco come fare: Prendiamo il nostro cd preferito che conosciamo alla perfezione, selezioniamo una traccia e rippiamola sul pc rigorosamente in formato non compresso wav. Per l'operazione consiglio di usare EAC. A quanto punto ci serve un programma che consenta di comprimere il wav e comparare i due files. Chi meglio di foobar2000 è idoneo per questo? ![]() Fate l'installazione completa e lanciate il player. Aprite il wav da foobar e cliccate con il destro -> convert -> to same directory Si aprirà un menù a tendina, come prima prova selezionate LAME (MP3) con il preset -V 2 (192 kbps vbr). Non resta che importare il file dentro foobar: ora nella playlist ci sarà sia il wav che l'mp3. Selezionateli entrambi, di nuovo click con il destro -> Utils -> ABX Two tracks.. Comparirà questa simpatica schermata: ![]() Come vede è molto intuitivo. Consiglio di selezionare hide results per non farsi condizionare, e fare la comparativa su spezzoni di 30 secondi, usando set start/end e spostando il cursore quando siete in pausa. Il meccanismo è molto semplice: cliccate su play A e su play B. Uno è il file wav e l'altro è l'mp3. Dovete scoprire quale di questi corrisponde a X, e quale a Y. Quando siete sicuri, selezionate una delle due opzioni in Choice. Selezionate i 30 secondi successivi della canzone, fino a quando arrivate alla fine. Una volta terminata, vi salverà un report in txt. Tutto quello che vi chiedo è di postare qui sul forum il risultato, indicando la vostra configurazione (scheda audio e diffusori) e il titolo del brano usato. Magari prima iniziate con un brano pop/rock/commerciale, senza andare subito su musica classica/jazz dove è molto più facile scoprire le differenze ![]()
__________________
Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Feb 2003
Città: 134340 Pluto - [VL]
Messaggi: 8520
|
bello bello...
adesso mi armo di tutto punto dei software che servono e poi provo. Ciao
__________________
D'OH!
|
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Feb 2003
Città: 134340 Pluto - [VL]
Messaggi: 8520
|
ma perchè proprio a 192Kbps vbr?
io tutti gli MP3, anche quelli che metto nel lettore MP3 portatile li comprimo a 320Kbps. Ciao
__________________
D'OH!
|
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Apr 2001
Città: Torino (provincia)
Messaggi: 960
|
ovviamente più è basso il bitrate, maggiore è la compressione e la differenza con l'originale. Ho proposto come base di partenza il preset -V 2 che corrisponde a un bitrate medio, né troppo alto né troppo basso. In base alle capacità di ognuno e magari al genere musicale del file rippato, è possibile salire o scendere di bitrate fino a trovare la soglia di rilevamento differenze.
Questo test può anche essere utile anche per decidere con quale compressione salvare i files da usare in lettore mp3. Tu ad esempio comprimi mp3 a 320 kbps. Potresti salvare lo stesso file (sempre partendo dal wav mi raccomando!!) a diversi bitrate (96, 128, 192) e fare il test. Se scoprissi ad esempio che non rilevi differenze tra i file a 192 e 320 potresti salvare tutto a 192 salvando un bel di spazio sul lettore senza perdere niente come ascolto ![]()
__________________
Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy. |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Feb 2003
Città: 134340 Pluto - [VL]
Messaggi: 8520
|
si questo lo avevo capito dei bitrate differenti...
non riuscivo a capire solo come mai avevi preso 192 come dato di partenza... ora ho capito tutto Ciao
__________________
D'OH!
|
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jun 2006
Città: Roma
Messaggi: 1768
|
Penso che prima di tutto bisognerebbe stabilire anche dove vengono ascoltati i file audio.
Una prova in ascolto con casse da 2 watt o con coni da 5 cm di diametro non ha molto senso...così come un ascolto sugli steretti da supermercato tutto in uno a venti euro... Almeno casse da impianto stereo buone. |
![]() |
![]() |
![]() |
#7 | |
Senior Member
Iscritto dal: Jun 2006
Città: Roma
Messaggi: 1768
|
Quote:
Il motivo risiede nell'acustica e nel trattamento digitale delle informazioni audio. Appena ho tempo spiego il motivo. E cominciamo a sfatare un bel po' di miti... |
|
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Apr 2002
Città: Vicenza
Messaggi: 2124
|
Presa dall'ALTRO THREAD
Quote:
Comunque IMHO dire che "l'mp3 fa schifo a prescindere" mi sembra un po' eccessivo, credo che solo una piccola percentuale di noi possa apprrezzare la superiorità di un wav rispetto a un mp3 ben fatto a 320kbps, io con i miei mezzi sicuramente no. |
|
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Apr 2001
Città: Torino (provincia)
Messaggi: 960
|
Innanzitutto, grazie per aver accolto il mio invito a proseguire qui la discussione.
![]() Quote:
Quindi chiedo, a chi ha voglia, di lanciarsi in questa prova per verificare quanto incide una compressione lossy e a che bitrate. Il risultato non sarà una legge fisica imprescindibile, ma un puro dato statistico ai fine di un'indagine tra noi. Giusto per dire "l'utente x con l'impianto y da n euro inizia a percepire differenze sul brano z a partire dal bitrate m", ok? ![]() Per me è sbagliato condannare a priori gli mp3/aac, ci sono molti contesti in cui sono più che adeguati, a seconda del genere musicale/impianto del fruitore. E cmq non vi va di mettervi alla prova e vedere quanto avete l'orecchio fine? Non ho ancora visto neanche un log ![]()
__________________
Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy. |
|
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: Jun 2006
Città: Roma
Messaggi: 1768
|
Dunque visto che sul thread delle schede audio ho visto scrivere tante stupidaggini (perdonatemi ma è proprio così), sono costretto a fare una piccola lezioncina (Dio solo sa se odio queste cose!) perchè mi pare che tanta gente abbia le idee un po' confuse su come funziona il campionamento digitale.
In natura un suono od un rumore è composto da onde di pressione acustica, generalmente chiamate onde sonore; queste onde sonore risuonano in uno spettro di frequenze che sono teoricamente infinite. Teoricamente perchè, essendo il prodotto di oggetti che vibrano, ci sarà un limite di vibrazione inferiore dato dallo stato di quiete ed un limite superiore dato dal coefficiente chimico di rottura dell'oggetto (parliamo per ora degli oggetti solidi). Quindi il suono è un fenomeno fisico quasi infinito che viene percepito in maniera non lineare. Che vuol dire quasi infinito? Per via del teorema di Fourier, un fenomeno ondulatorio periodico, come ad esempio il suono, può essere rappresentato per mezzo della cosiddetta serie di Fourier: a + (sommatoria di k che va da 0 a + infinito) (b* (cos (ka) + sen (ka)) a è chiamata fondamentale e le sommatorie del polinomio armonici; questo per quanto riguarda i suoni puri. Per i suoni impuri o rumori il discorso è più complesso, per ora trascuriamolo. Quindi avremo una forma d'onda che è composta più o meno così: ![]() Tra i due limiti estremi l'oggetto quindi vibrerà in maniera infinita, dato che tra due linee di armonici ci sarà sempre un armonico tra di essi compreso. Propagandosi in un mezzo elastico (generalmente l'aria), le onde sonore arrivano al nostro orecchio; questi ha un range di sensibilità che va grossomodo dai 20 ai 20.000 Hz e in quest range capta onde sonore in maniera non lineare e le trasmette al nostro cervello. Anzitutto che significa non lineare? Non lineare significa che noi non percepiamo tutte le frequenze alla stessa intensità, ma alcune le sentiamo di più altre di meno. Uno scienziato, Fletcher fece delle misurazioni su un campione di circa mille persone e trovò che l'ascolto medio dell'orecchio umano è il seguente: ![]() In ascissa (linea orizzontale) abbiamo le frequenze, in ordinata (linea verticale) abbiamo la potenza in decibel. Come si vede le frequenze basse sono scarsamente percepibili dall'orecchio, e servono potenze abbastanza elevate (sui 70 db) per poter essere apprezzate; di contro sulle frequenze acute l'orecchio è molto sensibile. Quindi possiamo capire da questo grafico che l'esposizione a frequenze medio alte a volumi eccessivi è molto più dannoso dell'esposizione a frequenze basse. Piccolo OT notate il massimo picco di sensibilità nei pressi dei 3500 Hz, che è esattamente la frequenza del pianto di un neonato. Ora questo avviene in natura. Nel campo del digitale come viene riprodotto? Anzitutto, essendo il digitale una funzione discreta, non può rappresentare tutti i valori degli armonici, ma avrà una approssimazione; come avviene quindi la digitalizzazione di un suono? Anzitutto si passa per un passaggio fondamentale che si chiama conversione analogico digitale; questa avviene in questo modo: ![]() Nel primo grafico in alto abbiamo il nostro segnale analogico. Nei grafici successivi, ad intervalli di tempo, il campionatore va a misurare (linee verticali sul grafico) il valore del segnale analogico; creerà quindi una tabella con indicati i valori numerici del segnale ad x tempo. Maggiori sono le volte che si effettuano le misurazioni, migliore sarà la ricostruzione del segnale, perchè i valori sono più vicini tra loro. Difatti man mano che la frequenza di campionamento aumenta migliora l'accuratezza della ricostruzione sonora. Quindi cos'è la frequenza di campionamento? E' il numero di volte che il campionatore misura il segnale analogico. Quindi una frequenza di campionamento infinita riprodurrebbe esattamente il fenomeno analogico. E' chiaro però che questo non è possibile perchè dovrei avere immagazzinamento infinito (i numeri li memorizzo in un mezzo fisico, come un un buffer o una ram) e perchè ci sono dei limiti di calcolo (i numeri reali non sono tutti finiti, pensiamo ad un armonico tipo 160,36788468619846...etc. di Hz), quindi per forza di cose avremo un segnale approssimato. Ora però non abbiamo considerato che anche il segnale analogico ha una sua frequenza; abbiamo visto prima che le frequenze utili per l'orecchio vanno da 20 a 20.000 hz. Quindi: qual'è la frequenza minima utile che mi permette di campionare con sufficiente sicurezza l'intera gamma sonora percepita dall'orecchio? Il Teorema di Nyquist afferma che data una frequenza da campionare, la frequenza di campionamento dev'essere maggiore od uguale al doppio della frequenza da campionare. Quindi se il limite umano è 20.000, la frequenza minima accettabile è 40.000 Hz. E siccome dobbiamo tenere conto delle tolleranze, degli errori di calcolo e di svariati fattori, il limite minimo si considera su una frequenza di 44.100 Hz. Ecco quindi da dove deriva realmente lo standard 44.100! Domanda: e cosa sono i bit? Si sente parlare spesso di 16, 24 e 32 bit... I bit sono le grandezze possibili in misurazione: ossia più bit ho maggiore è la gamma dinamica che posso esprimere. In parole povere: la frequenza di campionamento riproduce la linea in orizzontale, i bit di campionamento riproducono i db in verticale. Un segnale a 16 bit ha dinamica minore di uno a 32 bit. Ed ora uno sguardo ad un file audio compresso. I dati contenuti in un file audio sono tutti valori delle frequenze e delle dinamiche; se devo ridurre la dimensione di questo file, necessariamente devo tagliare o ridurre qualcosa. Però quello che taglio non sono dati ricostruibili, perchè l'algoritmo di compressione fa un'operazione di questo tipo. Supponiamo di avere una tabella di valori audio e dinamiche come la seguente: Frequenza----------------------------------- 20 46 108 54 103 13 25 220 Dinamica------------------------------------- 76 44 98 55 113 11 37 440 Tempo -------------------------------------- 1 2 3 4 5 6 7 8 Quindi a tempo 1 avremo la frequenza 20 a 76 db, a tempo due la frequenza 146 a 44 db etc. Gli studi di psicoacustica hanno permesso di accertare che l'uomo non è sensibile nello stesso modo a tutte le frequenze e che un suono ad alta intensità ne maschera uno con frequenza vicina ma intensità più bassa. Sfruttando queste ed altre considerazioni, si può pensare di eliminare l'informazione che non verrebbe comunque percepita ed ottenere quindi un buon rapporto di compressione. Cioè nella tabella precedente io "taglio" i valori maggiori che mi occupano più spazio (103, 220 e 108 in digitale sono molto onerosi da scrivere - ricordo che le scritture sono in binario) e li approssimo con frequenze che, tramite il mascheramento psicoacustico, me le "ricordano". Le ricordano ma non sono quelle originali. Ed è una bella differenza! In un file audio inoltre le informazioni sono contenute in numeri binari; nella nostra tabella di esempio abbiamo visto che ad un secondo corrisponde un solo valore di frequenza, ma sappiamo che in un secondo di un brano musicale ci sono molto più di una frequenza suonata: pensate ad una scala di un chitarrista ad esempio! Quindi ad ogni secondo c'è un certo numero di bit che contiene le informazioni sulle frequenze ed intensità. Questo numero di cifre binarie è detto bitrate. In altre parole il bitrate è il numero di cifre binarie impiegate per immagazzinare un secondo di informazione. Questo può essere costante per tutta la durata del file o variare all'interno di esso. Ad esempio i cd musicali vengono campionati (registrati) ad una frequenza pari a 44.100Hz. Da ciò si evince che ogni secondo si hanno 44.100 valori registrati dall'ipotetico microfono che vanno poi moltiplicati per i 2 canali del suono stereo che vanno a loro volta moltiplicati per 2 poiché la registrazione avviene a 16 bit (pari appunto a 2 byte). Quindi avremo: 44.100 x 2 x 2 x 60 (secondi) = ~10 MB ogni minuto La compressione, diminuendo la lunghezza globale del file, diminuirà di conseguenza il bitrate medio. Il bitrate medio diventa dunque in questi casi l'indice dell'entità della compressione. Ad esempio se il file di origine possedesse un bitrate di 1411 Kbit/s - ognuno dei quali ricordo è un valore di frequenza e dinamica -e il file compresso possedesse un bitrate medio di 320 Kbit/s, allora avremmo ridotto di un fattore pari a circa 4,5. Il che significa che delle frequenze originarie del file audio non compresso ne conservo una ogni 4,5. Il resto è "ricostruito" dal mascheramento... Ecco quindi che un file audio compresso ha minor capienza in termini di kb, ma ha anche minore accuratezza, frequenze tagliate e ricostruite molto approssimativamente... Esistono inoltre due tipi di compressione: cosiddetta senza perdita e con perdita. Usando un algoritmo di compressione senza perdita, dal risultato della compressione si può riottenere tutta l'informazione originaria. In questo caso la riduzione massima generalmente ottenibile, utilizzando algoritmi studiati appositamente per l'audio è all'incirca del 60%, ma solo con alcuni tipi di suono. Si possono utilizzare gli stessi algoritmi generali di compressione (come per esempio ZIP o Gzip) ma i risultati in termine di riduzione sono inferiori. Esempio: FLAC, APE, ALE Negli algoritmi di compressione compressione audio con perdita non si può più ottenere un suono identico all'originale ma la riduzione ottenibile è molto spinta: con rapporti di compressione di 10 a 1, il risultato è quasi indistinguibile dall'originale ma ci si può spingere anche oltre a discapito della qualità. Spero di aver chiarito abbondantemente l'aspetto fisico ed informatico del problema! |
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: Apr 2001
Città: Torino (provincia)
Messaggi: 960
|
grazie per la spiegazione esauriente, un ripasso fa sempre bene
![]() Piccola precisazione per la scelta della Fc Quote:
![]()
__________________
Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy. Ultima modifica di Diabolik.cub : 10-02-2007 alle 12:08. |
|
![]() |
![]() |
![]() |
#12 | |
Senior Member
Iscritto dal: Aug 2005
Messaggi: 2755
|
Quote:
__________________
|
|
![]() |
![]() |
![]() |
#13 |
Moderatore
Iscritto dal: Jun 2003
Città: MILANO
Messaggi: 42143
|
__________________
LianLi Pc-A05FN | Gigabyte B450 AORUS PRO | Amd Ryzen 5600X | Schythe Mugen 5 Rev.b | 2*8Gb DDR4 3200MHz | RTX 4060 Ti | BE QUIET! Straight Power 11 Platinum 550W | Dell U2518D | Logitech G602 | Logitech MX Keys | LG 55CX6LA | Onkyo SE-200PCI | Empire PS-2120D Modded | My Hi-Fi | |
![]() |
![]() |
![]() |
#14 | ||
Senior Member
Iscritto dal: Apr 2001
Città: Torino (provincia)
Messaggi: 960
|
Quote:
Quote:
Ho creato questa discussione per ridurre un po' gli OT nel thread sulla scelta scheda audio e soprattutto per proporre questo semplice test che nessuno ha ancora fatto.. Dai sacd inizia tu che hai sicuramente un super impianto rivelatore ![]()
__________________
Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy. |
||
![]() |
![]() |
![]() |
#15 | |
Senior Member
Iscritto dal: Jun 2006
Città: Roma
Messaggi: 1768
|
Quote:
E' opinione comune ed errata che il formato CD sia stato introdotto come derivazione dall'audio broadcast per il video. Non è così. E' semplicemente il miglior rapporto di qualità "commerciale" ottenibile. Il grafico è un esempio, chiaro che una voce o uno strumento hanno un andamento stratigrafico. Sostituisci alla linea di esempio lo strato di frequenze di un qualsiasi suono il risultato è lo stesso. |
|
![]() |
![]() |
![]() |
#16 |
Senior Member
Iscritto dal: Apr 2001
Città: Torino (provincia)
Messaggi: 960
|
cosa intendi per stratigrafico? Quindi i 44100 oltre ad essere divisi per il tempo vanno anche suddivisi per i vari "strati di frequenza"? Quanti sono indicativamente?
Un grafico di questo strato di frequenze farebbe comodo per capire meglio ![]()
__________________
Nel mercatino ho concluso con: eleoluca, huangwei, jai, ^v3rsus, Rinos, arvey, kinderboy. |
![]() |
![]() |
![]() |
#17 |
Moderatore
Iscritto dal: Jun 2003
Città: MILANO
Messaggi: 42143
|
http://groups.google.it/group/it.com...0109b09faa0ce9
http://www.lithium.it/articolo0012p1.htm http://www.nemesi.net/audio2.htm http://www.di.unipi.it/~romani/IAD/IAD4.pdf
__________________
LianLi Pc-A05FN | Gigabyte B450 AORUS PRO | Amd Ryzen 5600X | Schythe Mugen 5 Rev.b | 2*8Gb DDR4 3200MHz | RTX 4060 Ti | BE QUIET! Straight Power 11 Platinum 550W | Dell U2518D | Logitech G602 | Logitech MX Keys | LG 55CX6LA | Onkyo SE-200PCI | Empire PS-2120D Modded | My Hi-Fi | |
![]() |
![]() |
![]() |
#18 |
Senior Member
Iscritto dal: Dec 2004
Città: Milano
Messaggi: 4631
|
Ragazzi, iniziamo a parlare di cose empiriche...Prove?
![]() Non ci dimentichiamo l'incisione originale che alla fine è il vero Cucuzzolo della montagna della riproduzione sonora...al di là delle digitalizzazioni più o meno valide... Provate ad ascoltare un Schubert o un Ludovico Van della Deutsche o della Decca....beh...non c'è paragone IMHO a favore di quest'ultima ![]()
__________________
MacBook Pro Early 2011, MacOs High Sierra- Apple Time Capsule 2Tb - iPhone 6s Plus Space Grey 128G |
![]() |
![]() |
![]() |
#19 | |
Senior Member
Iscritto dal: Jun 2006
Città: Roma
Messaggi: 1768
|
Quote:
|
|
![]() |
![]() |
![]() |
#20 | |
Senior Member
Iscritto dal: Jun 2006
Città: Roma
Messaggi: 1768
|
Quote:
Il primo processo passa per una consolle analogica che campiona dai microfoni, converte con i propri convertitori o con convertitori serie Madi o Apogee e passa al banco effetti e da qui al pc. Il risultato è un file audio campionato in genere a 48 Khz 24 bit (ormai parecchi studi di registrazione lavorano così) ed elaborato all'interno di software quale Nuendo, Cubase, Sonar, Performer e Protools (Logic se si ha solo Apple). Dopodichè si fa il mastering a formato CD (16 bit 44.100 Hz) con convertitori professionali e filtri anti dithering e si imprime il master, con CD writer professionali. Se invece si prende del materiale audio vecchio si può tentare un restauro e successiva masterizzazione in digitale, ma molto dipende da che tipo di audio. Un mio collega stava lavorando tempo addietro all'audio del film Pepe le Moko, degli anni 30. Audio mono, ipersupercompresso, estrapolato da nastro magnetico pieno di rumori e in pessimo stadio di conservazione. Ci puoi fare poco o niente. Ed in quel caso la digitalizzazione più di tanto non migliora la cosa, anzi, semmai ti esalta i lati peggiori dell'audio. |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 22:22.