View Single Post
Old 19-11-2010, 09:59   #16
yossarian
Senior Member
 
Iscritto dal: Mar 2001
Messaggi: 5390
Quote:
Originariamente inviato da Someone Guarda i messaggi
Nei grafici linkati manca l'architettura Fermi. Consideriamo che questa è 8 volte più veloce in DP del G200 per un'area più o meno uguale. Ricordo che le Tesla usano memoria ECC che usa più energia della memoria "normale" quindi il punto di efficienza diminuisce leggermente anche per questo.
infatti è specificato che si tratta di processori della precedente generazione (non compare neppure la serie 5xx0 di ATi); inoltre GT200 in DP non fa testo in quanto ha una capacità di calcolo veramente ridotta


Quote:
Originariamente inviato da Someone Guarda i messaggi
I bench del secondo link sono interessanti, ma sono specifici per singola operazione. Nei calcoli veri non si esegue la stessa istruzione un milione di volte e basta saturando in maniera artificiale tutti gli SP alla loro massima efficienza. Entrano in gioco molte altre cose, come ad esempio la capacità di passare i risultati da un thread al successivo o di mixare istruzioni diverse.
Nei bench OpenCL, gli unici che permettono di avere un confronto diretto tra le due architetture, si vede che l'architettura Fermi funziona meglio in quasi tutti gli scenari.
Negli algoritmi dove non si fa solo moltiplicazioni di matrici in DP ad hoc per mostrare la massima efficienza dell'architettura, si vede dove le capacità dell'architettura nvidia vs quella AMD prevale.
nell'esecuzione di calcoli matematici, come quelli utilizzati in ambito GPGPU, i valori misurati sperimentalmente sono molto prossimi a quelli teorici, al contrario di quello che succede in ambito videoludico, proprio perchè non ci sono operazioni ad elevate latenze che possono far stallare la pipeline o rallentare l'elaborazione. I valori teorici di fermi e di cypress li conosciamo e quelle tabelle mostrano quelli sperimentali.

Quote:
Originariamente inviato da Someone Guarda i messaggi

Nel campo professionale si usano le capacità di calcolo per fare cose che non sono sole ed esclusivamente quello di muovere poligoni sullo schermo come nei videogiochi.
Potresti spiegare altrimenti come è possibile che il Cypress che nel campo videoludico praticamente sta un solo passo dietro al GF100, nel campo professionale sta 5 o 10 passi indietro. E le specifiche delle schede Quadro non sono quelle GeForce. Nelle Quadro si usa il chip della 470 con frequenze inferiori. I bench dei consumi indicano addirittura che queste schede consumano meno delle schede AMD e vanno di più. Una cosa che a guardare i bench dei videogiochi nessuno crederebbe.
i test che hai linkato riguardano applicazioni di grafica pro e non GPGPU (li le tesla non c'entrano niente). Per questo ti ho chiesto a quali applicazioni pro fai riferimento. E, nel caso di grafica pro, si tratta sempre di muovere poligoni con annessi e connessi (comprese operazioni di texturing, ad esempio). Inoltre, anche in quei grafici si vedono test in cui le quadro sono avanti, in alcuni anche molto avanti, ma se ne vedono altri in cui sono indietro (a volte anche molto indietro). Inoltre non ho trovato scritto da nessuna parte che le quadro consumino meno delle firegl.
In quanto alle differenze di prestazioni, i grafici presenti nell'articolo che ho linkato possono dare molte risposte, anche per quanto riguarda il campo consumer. Se un SW fa molto uso, ad esempio, di istruzioni di tipo scalare in fp32 o di heavy tessellation (come alcuni bench sintetici) i chip nVidia sono sicuramente avvantaggiati.
yossarian è offline   Rispondi citando il messaggio o parte di esso
 
1