|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#8141 | |
|
Senior Member
Iscritto dal: Feb 2002
Città: Discovery
Messaggi: 34710
|
Quote:
__________________
Good afternoon, gentlemen, I'm a H.A.L. computer. |
|
|
|
|
|
#8142 |
|
Bannato
Iscritto dal: Jan 2006
Città: Red Light District
Messaggi: 13937
|
|
|
|
|
|
#8143 | |
|
Senior Member
Iscritto dal: Oct 2005
Messaggi: 3669
|
Quote:
|
|
|
|
|
|
#8144 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
il chip o lavora in sp o in dp; non può fare l'una e l'altra cosa contemporaneamente. Quindi non può aviluppare un potenziale teorico di 1,74 Tflops in sp e utilizzare, contemporaneamente, altre 870 Gflops per fare altro. In GT300 non ci sono alu dedicate alla dp ma sono le stesse alu che lavorano in sp che, accoppiate a due a due, eseguono calcoli in dp. Detto questo, i 1700 MHz sono speculazioni (speranze?) di Rys. L'unico dato di fatto è che le frequenze della serie testla sono più basse di quanto ci si aspettava, il che non depone bene neppure per le geforce, da questo punto di vista. Inoltre, resta l'incognita delle madd e di come saranno eseguite. Saranno sostituite da fma? Forse, se sarà possibile e, comunque, la cosa non avverrà in maniera indolore (cicli persi e impossibilità di effetuare sempre la sostituzione). Se consideri le sole madd, anche ammettendo i 1700 MHz, avresti solo 870 Gflops per fermi in fp32. |
|
|
|
|
|
#8145 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Inoltre, non è detto che ciò avverrà e, sicuramente, non avverrà in tutti i casi (continui a non tener conto della propagazione degli errori per shader più lunghi e le dx11 prevedono shader molto lunghi) |
|
|
|
|
|
#8146 |
|
Bannato
Iscritto dal: Jan 2006
Città: Red Light District
Messaggi: 13937
|
quindi pensi sia impossibile far lavorare in double precision la gpu eseguendo grafica?
|
|
|
|
|
#8147 | |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 7819
|
Quote:
__________________
Sample is selezionated !
|
|
|
|
|
|
#8148 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
|
|
|
|
#8149 |
|
Senior Member
Iscritto dal: Feb 2002
Città: Discovery
Messaggi: 34710
|
architetture diverse. è sempre stato cosi(o cmq da molto tempo) che Nvidia nonostante valori ben inferiori era superiore alla concorrenza. e credo che questo sia il dato + importante non quanto la comparazione tra le due case ma tra le due schede ovvero la GTX285 e la GTX380(chiamiamola cosi). se in quell'articolo si citano 1700 chissa può essere altri dicono altro e quindi, non ci rimane che rimanere in attesa di tutti i riscontri del caso.
__________________
Good afternoon, gentlemen, I'm a H.A.L. computer. |
|
|
|
|
#8150 | |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
Quote:
|
|
|
|
|
|
#8151 |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
bè in effetti la cosa era uguale anche con RV770 e GT200 anzi mi sa che ATi era meglio anche in DP eppure contro una GTX 285 le 48xx le prendevano.
ATi sembra che abbia fatto la moltiplicazione di 2 sui dati della 4890 nulla di più. sia SP che DP sembrano solo la moltiplicazione di 2 della 4980. Bè Nvidia invece sembra salire oltre il raddoppio, sia in SP che in DP, anche così comè adesso sembrerebbe poter battere ATi senza troppi problemi. Il fatto non potrebbero essere i colli di bottigli della banda o dei registri interni, magari anche cache e roba varia ? |
|
|
|
|
#8152 |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
Non è vero, R600 la cosa che impressionava di più erano gli stream che noi tutti pensavamo come gli stream di nvidia invece eranos tream differenti. Ma come potenza di calcolo teorica era simile al G92.
tieni conto che l'R600 era all'inizio superiore alla 8800GTS, poi ATi è ovvio che non è riuscita a sostenerla, se capitasse una cosa del genere a Nvidia è ovvio che le cose sarebbero differenti, quella si fa ottimizzare tutti i titoli e cerca di puntare tutto sui driver. |
|
|
|
|
#8153 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Dallo steso articolo, basta vedere l'immagine iniziale: sono 16 cluster; se ciascuno fosse composto da 16 unità fp32 e 16 fp64, allora in sp fermi avrebbe la metà della potenza elaborativa riportata in tabella (avrebbe solo 256 unità fp32 e non 512). Ripeto, se hanno scritto qualcosa del genere, hanno le idee piuttosto confuse pure loro In realtà, ogni cluster è composto da 2 blocchi di 16 alu fp32 che, in caso di calcoli fp64, si comportano come un unico blocco da 16 alu. Ultima modifica di yossarian : 24-11-2009 alle 11:11. |
|
|
|
|
|
#8154 | ||
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
Quote:
Quote:
|
||
|
|
|
|
#8155 | |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 7819
|
Quote:
http://techreport.com/articles.x/17815/4 1° pagina: Fermi now has single-SM clusters, although each SM is effectively a pair of 16-way vector sub blocks. Sub-block configuration is the key to Fermi implementation configuration. GF100, the high-end part that Nvidia outlines in the whitepaper, uses two different sub blocks in each of its sixteen SMs. 4° pagina: Going back to the sub-block discussion, it should be clear how Nvidia might scale Fermi down to smaller variants and create derivatives. Nvidia could simply (and we use that term with all due respect to the actual difficulty involved) replace the DP-capable sub block with another of the simpler blocks. They could retain everything else about the SM, including the same scheduler, near pools, register file and even the operand gather logic. That lets them create non-DP variants, losing some of the fearsome integer rate in the process as well (some of the integer hardware is shared with the DP silicon, necessitating that), for derivatives that don't require it, because they're addressing different markets. Double-precision floating point is almost exclusively a non-graphics feature of GPUs, at least at this point in time (although, of course, extended-precision computation takes place all over the chip in non-programmable forms), and so it still makes sense to remove it from derivative, smaller, cheaper parts. This modularity might also let Nvidia attempt a part with two DP sub blocks, with fairly minimal changes to the SM front end, if they so wish. Doing so will cost them area and power, but it's something they could take on. Overtaking the per-FPU, per-clock DP rate of Intel's microprocessors has to be appealing on some level.
__________________
Sample is selezionated !
Ultima modifica di Foglia Morta : 24-11-2009 alle 11:16. |
|
|
|
|
|
#8156 | |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
Quote:
|
|
|
|
|
|
#8157 |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
potenza elaborativa che serve per calcoli professionali e tutto fuor'che il gaming, ci servirà? a me no
|
|
|
|
|
#8158 | ||
|
Senior Member
Iscritto dal: Feb 2006
Città: Looking for a place to call home
Messaggi: 5325
|
Quote:
I benefici erano vari: ogni shader core è indipendente, quindi può essere sfruttato fino in fondo. I core delle ATi, invece, essendo di fatto Vec4+1 riescono ad usare sì e no la metà delle risorse massime a disposizione in una situazione reale... Ed è questo il motivo per cui è difficile fare una comparazione tra il numero di cores (e quindi i GFlops teorici) delle 2 architetture. Con Fermi però alcuni punti di forza di quell'architettura sembrano venire meno. L'impatto della trasformazione MADD->FMA è ignoto. Quote:
L'unica cosa che è più che raddoppiata sono gli shaders, col problema che però ora non sono più in grado di fare nativamente l'operazione che più viene usata nei giochi (MADD), o meglio, la sa fare, ma non non nello stesso esatto modo. Per poter calcolare tutte le MADD che ci saranno nel codice Fermi dovrà prima perdere un pochino di tempo per fare quanto diceva yossarian. Le TMU non saranno raddoppiate, anzi con Fermi NVidia abbasserà il suo rapporto ALU:TEX al livello di ATI, perdendo un altro dei suoi punti di forza. Ricapitolando: TMU non raddoppiate, ROPs non raddoppiate, banda tutt'altro che raddoppiata, ALU che dovranno perdere più tempo per calcolare le MADD... Mi chiedo dove stia il raddoppio, o meglio da cosa possa venir fuori. E' assurdo che ad ogni giro la gente si faccia gabbare da numeri che hanno un valore assoluto molto limitato... Ai tempi di GT200 dicevo la stessa cosa (che non poteva andare 2x G80) e in pochi mi diedero retta. Indovinate chi ebbe ragione?
__________________
A.L.M. @ HWBOT | Personal PC: Asus N56VZ | Work PC: Lenovo Thinkpad T420 (Core i5 2520M, 4GB ram, 320GB 7200rpm) | Mobile device: iPhone 4S Work It Harder, Make It Better, Do It Faster, Makes Us Stronger, More Than Ever Hour After Hour Work Is Never Over Ultima modifica di A.L.M. : 24-11-2009 alle 11:24. |
||
|
|
|
|
#8159 | |
|
Senior Member
Iscritto dal: Oct 2005
Messaggi: 3669
|
Quote:
|
|
|
|
|
|
#8160 | |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
Quote:
& la GTX 285 0.78 Tflop/s in SP ? Eppure fra GTX 285 e 4870 c'è un bel distacco. Ripeto che dai dati sembra che Nvidia abbia migliorato più di ATI e ha anche una banda passante, più ROPS ecc, bisogna vedere poi come vengono gestite le cose. Come mai la 4870 non è stata in grado di battere la GTX 285 ? nonostante la differenza netta in SP ? quella potenza in più dove è finita ? . |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 12:16.























