Riproduzione video e schede video: la verità

La capacità di gestire grafica tridimensionale non è il solo aspetto da valutare in un processore grafico. Una schiera di utenti sempre più folta, infatti, rivolge particolare attenzione anche ad un altro aspetto: la riproduzione video. In questo articolo saggiamo qualità e prestazioni delle più diffuse soluzioni ATI e NVIDIA in questo campo.
di Raffaele Fanizzi pubblicato il 20 Gennaio 2006 nel canale Schede VideoNVIDIAATI
Deinterlacciamento e 3:2 Pulldown
Il deinterlacciamento dell'immagine è una delle problematiche principali, se non la principale, che sopraggiunge nel momento in cui riproduciamo un filmato in formato digitale. Molte sorgenti video (DVD, trasmissioni HD in digitale, ecc...) e apparati di registrazione (ad esempio le videocamere digitali), infatti, invece di lavorare su una sequenza di immagini complete per ogni frame (denominata progressive scan), immagazzinano solo metà dell'immagine in ogni frame dando così vita a frame interlacciati chiamati fields o campi. Normalmente la suddivisione dell'immagine avviene in ogni frame scomponendola in una serie di righe poi suddivise in field con righe pari e field con righe dispari. Volendo fare un parallelismo con il mondo della grafica tridimensionale possiamo paragonare questo modo di trattare l'immagine con quello visto nella tecnologia SLI di 3dfx.
Nel momento in cui tali flussi video devono essere riprodotti su uno schermo digitale è necessario effettuare un'opera di ricostruzione dell'immagine denominata appunto deinterlacciamento. Tale operazione non è particolarmente complessa quando abbiamo un'immagine statica: è sufficiente fondere due fields consecutivi per ottenere l'immagine completa. Tuttavia, se il video è stato registrato in modalità interlacciata ad ogni field corrisponde, oltre ad una configurazione dell'immagine diversa (righe pari o dispari), anche un istante di tempo differente il che comporta una serie di artefatti grafici quando l'immagine è movimentata. Risulta, quindi, evidente che la tecnica di deinterlacciamento implementata nel processore video è fondamentale per garantire una buona qualità durante la riproduzione. In generale esistono tecniche che agiscono sia a livello di frame che, le più avanzate, a livello di pixel. E', infatti, necessario rilevare, a seconda delle caratteristiche del filmato (più o meno movimentato), quale tecnica adottare e, naturalmente, effettuare una valutazione per pixel è una scelta migliore, oltre che computazionalmente più costosa, rispetto a considerare singolarmente frame per frame.
Un'altra problematica è relativa alla cosiddetta cadenza. Normalmente i film sono registrati utilizzando un formato a 24 frame per secondo. Tuttavia nel momento in cui vengono rilasciati al pubblico attraverso DVD o trasmissioni TV digitali, è necessario adeguarsi allo standard supportato dalla TV. Lo standard NTSC, ad esempio, richiede video da 30 fps o 60 fields al secondo. La conversione del frame rate dai 24 fps originali ai 30 fps richiesti è un'operazione denominata frame rate conversion.
La prima manovra che si compie in questi casi è estrapolare da ogni frame della sorgente video due fields alternativamente dotati delle righe pari e delle righe dispari di ogni frame. Ciò dà vita ad un video interlacciato in un formato a 48 fields per secondo. Per recuperare i 12 fields mancanti si duplica un field ogni cinque. Se prendiamo, quindi, due frame A e B del film originale a 24 fps, questi vengono inizialmente decomposti in quattro fields (A-pari, A-dispari, B-pari e B-dispari). Successivamente ogni due frame, uno dei quattro fields ad essi associato viene duplicato. Avremo quindi una sequenza del tipo: A-pari, A-dispari, B-pari, B-dispari e B-pari. Aggiungendo un field ogni quattro arriviamo ai 60 fields (o 30 frame) desiderati. Questa operazione è chiamata 2:3 cadence proprio perché due field di un frame sono seguiti da tre fields del frame successivo.
Quando dobbiamo riprodurre un filmato siffatto su un display di tipo progressive scan è necessario utilizzare una tecnica di deinterlacciamento per ricostruire correttamente i 24 fps originari. Una caratteristica che contraddistingue questo tipo di deinterlacciamento è che, contrariamente a quanto visto in precedenza, ognuno dei due (o tre) fields di un frame non si riferisce ad istanti di tempo differenti, ma sono relativi alla medesima immagine dal quale sono stati precedentemente estrapolati. Per poter riprodurre correttamente un film a 24 fps (i film su DVD sono quasi tutti in questo formato) è quindi necessario che la scheda video riconosca la sequenza regolare di fields 2:3 all'interno del filmato per poi ricostruire correttamente l'immagine. Questa funzionalità è denominata 3:2 pulldown.
Naturalmente quello che abbiamo esposto è il solo caso relativo ai film a 24 fps, ma la cadenza 2:3, benché sia indubbiamente la più diffusa, non è l'unica: alcune trasmissioni digitali via etere usano una cadenza 3:2:3:2:2, le videocamere professionali DVCAM usano 2:2:2:4 o 2:3:3:2, mentre i cartoni animati si affidano solitamente ad una cadenza 5:5, 6:4 o 8:7. Una scorretta operazione di pulldown, cioè di rilevamento della sequenza di fields e di ricostruzione dei frame porta ad una serie di artefatti grafici.
Descritte le due più interessanti problematiche legate alla riproduzione video testate dal HQV Benchmark possiamo passare alla discussione dei risultati ottenuti.