|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#8001 |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 7819
|
nVidia ,in mancanza d' altro, invia news sui brevetti depositati:
http://www.tcmagazine.com/comments.p...=31095&catid=6 With nothing new to show until Q1 2010, Nvidia still managed to put on a smile recently due to the fact that its IP portfolio has reached 1,000 patents. The milestone patent was awarded on October 27, it has been stamped with the number 7609272, and it talks about an invention that makes the pixel processing pipeline faster and more efficient through the use of all available circuitry for partial texture loads. According to the nTersect blog: "Textures can be 32-bit, 64-bit, or 128-bit. But anything larger than 32-bit requires more than one pass. Before Bastos and Kilgariff's invention, texture lookups were monolithic instructions that took multiple cycles to be executed, leaving other shader functional units to sit idle. “The idle units in the pipe presented the opportunity to try to fit other, non-texture instructions in those slots – i.e., run more than one instruction per cycle,” says Bastos. But to do that, the monolithic texture-load instructions had to be split into chunks. Break a 128-bit texture into four pieces – each of which can be completed in one pass – and that lets one cycle-hungry instruction be broken into four instructions. Doing this means that other circuits keep processing instructions – no more waiting." The partial texture load invention has first used for the GeForce 6 series cards and it also made its way into the RSX GPU which can be found in Sony's PlayStation 3 console. Edit: non conoscevo questo blog , ogni tanto postano qualcosa: http://blogs.nvidia.com/nTersect/
__________________
Sample is selezionated !
Ultima modifica di Foglia Morta : 23-11-2009 alle 12:44. |
|
|
|
|
#8002 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
1) nel caso che sia effettivamente confermato che le madd sono l ametà delle fma, si, allora sarebbe una mera questione di spazio perchè unità di tipo fma che eseguano madd devono avere degli stadi in più. 2) ci sono tre possibili risposte: a) la madd richiede il doppio dei cicli di clock perchè viene eseguita in due passate nella stessa alu anzichè in single pass; b) la madd richiede l'impiego di due alu che lavorino in serie e, in tal caso, l'istruzione è eseguita in single pass ma impiegando la metà delle alu totali; c) solo 256 alu hanno gli stadi in più per eseguire madd. Nel primi due casi le operazioni "mancanti in hardware" vengono emulate. 3) add e mul non sono eseguiti a mezza velocità; semplicemente una madd o una fma sono due flops (quindi devi raddoppiare il numero di istruzioni per avere il numero di operazioni), una add o una mul comportano una singola operazione. Quindi, stando a quanto riportato da hw.fr, in caso di fma hai, in totale, 1024 flops per ciclo (teoriche), ovvero 512*2; in caso di madd, 512 flops per ciclo (256*2), in caso di mul e add 512 flops per ciclo (una per ogni alu). Da notare che secondo la slide di hw.fr, le alu di GT300, al contrario di quelle di GT200, non eseguono la mul in più. |
|
|
|
|
|
#8003 |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
ma scusate quindi 512 stream cuda sono riferiti al top di gamma quindi un ipotetica GTX 380 ? Quindi suppongo che un ipotetica GTX 360 ne dovrebbe avere meno di 512, più probabilmente da punto di vista matematico 480 giusto ?
|
|
|
|
|
#8004 | |
|
Senior Member
Iscritto dal: Feb 2002
Città: Discovery
Messaggi: 34710
|
Quote:
__________________
Good afternoon, gentlemen, I'm a H.A.L. computer. |
|
|
|
|
|
#8005 |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
Quindi con 480 già sarebbe in linea su carta con la proposta ATI. Nel senso che han raddoppiato entrambi le proprie proposte senza vantaggio evolutivo di nessuno dei 2 per ora. Anzi se gli stream CUDA dovessere essere simili agli stream GT200 possiamo prevedere una situazione del tipo 4890 & GTX 275, non mi sembra male.
Vedremo come saranno questi stream CUDA, ma non potrebbero essere anche superiori a quelli di GT200 ? |
|
|
|
|
#8006 | |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
Quote:
|
|
|
|
|
|
#8007 |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
bè ma comunque bisogna vedere le prossime uscite di giochi per vedere chi sarà la vga migliore perchè Nvidia anche se inferiore va a finire che i giochi se li fa adattare dalle case.
tessellation hardware o emulato il modo di farcelo mandar giù lo trovano. |
|
|
|
|
#8008 |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
se c'è qualcosa in piu' nvida lo deve dichiarare visto che il progetto di fermi l'ha rilasciato a settembre per coerenza logica a mio avviso, e in quel progetto l'hardware tessalation non viene menzionato
|
|
|
|
|
#8009 |
|
Senior Member
Iscritto dal: Jun 2002
Messaggi: 9591
|
"Adattare" in che senso?
__________________
Via EH1/S3 Chrome 5400E + S3 Chrome 430GT + Via Quadcore @1,46Ghz all your base are belong to us |
|
|
|
|
#8010 |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
ma scusa, l'unica vga che va a quanto pare è la tesla, l'archittettura della tesla pare essere uguale alla quadro e alla versione Geforce e dagli schemi sto hardware tessalation non c'è, o l'hanno aggiunto e per coerenza dovrebbero annunciarlo almeno in una slide oppure non c'è
|
|
|
|
|
#8011 |
|
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Yoss, grazie per la tua risposta sulle FMA.
Volevo lanciare un ragionamento sulle capacità INT di Fermi. Come vediamo dagli schemi sono in misura preponderante rispetto a GT200 o Cypress. E' plausibile un utilizzo obbligato (dalle dimensioni del chip) per emulare le fixed-fuction ? Che io sappia il filtraggio delle texture e le rop's annoverano anche unità integer per calcoli come l'interpolazione. Prevedi un calo prestazionale considerevole se la previsione si rivelasse esatta ? Ultima domanda che avevo già posto, Quanto influiscono nei giochi attuali le capacità di addressing delle texture ? |
|
|
|
|
#8012 |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
che ottimizzano per Nvidia e mettono particolari funzioni o effetti o magari utilizzando particolari algoritmi che avantaggiano Nvidia e penalizzano ATI, io infatti mi ritrovo abbastanza problematicizzato con questa ATi che ho preso, prestazioni superiori alla evcchia GTX 275 ovvio però a livello di software non è il max.
Anche la 4890 come potenza elaborativa era superiore alla GTX 285 eppure è molto inferiore. |
|
|
|
|
#8013 | |
|
Senior Member
Iscritto dal: Feb 2006
Città: Looking for a place to call home
Messaggi: 5325
|
Quote:
Tra l'altro rileggendo l'articolo di hw.fr sembra che loro propendano per una soluzione in cui i CUDA cores nel caso in cui ricevano istruzioni MADD dividano l'operazione in una MUL ed una ADD, in modo da avere i 2 rounding "necessari". Questo appunto li porterebbe a fare le MADD in double pass (uno per la MUL e uno per l'ADD).
__________________
A.L.M. @ HWBOT | Personal PC: Asus N56VZ | Work PC: Lenovo Thinkpad T420 (Core i5 2520M, 4GB ram, 320GB 7200rpm) | Mobile device: iPhone 4S Work It Harder, Make It Better, Do It Faster, Makes Us Stronger, More Than Ever Hour After Hour Work Is Never Over |
|
|
|
|
|
#8014 | ||
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
Quote:
Quote:
|
||
|
|
|
|
#8015 | |
|
Senior Member
Iscritto dal: Jun 2002
Messaggi: 9591
|
Quote:
__________________
Via EH1/S3 Chrome 5400E + S3 Chrome 430GT + Via Quadcore @1,46Ghz all your base are belong to us |
|
|
|
|
|
#8016 | |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
Quote:
ATi nella seri 4 ne faceva di più della GTX 285 ma Nvidia penso che abbia sfruttato meglio le proprie funzionalità, no ? Tessellation o no, io queste grandi performance non le ho viste su ATI, cioè va come una 4870 x2 e meno di una GTX 295, teoricamente quando esce una new generation in automatico tutte le altre schede dovrebbero essergli inferiori e invece questa sembra un po' impacciata no ? |
|
|
|
|
|
#8017 | |
|
Senior Member
Iscritto dal: Jan 2007
Messaggi: 25157
|
Quote:
, son domande che ti poni comunque lecite ma totalmente ot. Vedremo come andrà gt300, e in base a come va valuteremo il mercato delle gpu meglio di come lo stiamo faccendo attualmente. leggendo l'articolo di hw.fr sono un po scettico su tutta sta potenza in ambito videoludico di fermi, spero e mi auguro che non sia cosi........per quanto riguarda i GFlops/s marchi male, le nvida son sempre state inferiori rispetto alle ati dall'uscita di rv780 di un anno e mezzo fa...... |
|
|
|
|
|
#8018 | |
|
Senior Member
Iscritto dal: Jun 2005
Città: Vitória(ES), Brasile
Messaggi: 8152
|
Quote:
Nemmeno con la 8800gtx (la migliore nVidia di sempre, e la migliore scheda di sempre insieme alla 9700pro), visto che quando lo SLI funzionava a dovere la 7900gx2 era davanti... Oltre al fatto che sono schede progettate per le dx11 (grande potenza negli SP, banda nella media cosi come il texturing), quindi vedremo le vere potenzialitá solo con i titoli dx11. Lo stesso dovrebbe valere per Fermi.
__________________
Se la vita ti da limoni ... Spremili in occhio a qualcuno e corri! |
|
|
|
|
|
#8019 | |
|
Bannato
Iscritto dal: Nov 2009
Messaggi: 342
|
Quote:
|
|
|
|
|
|
#8020 | ||
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Quote:
Per quanto riguarda le operazioni di texture filtering, in rv870 (di sicuro) e in fermi (molto probabilmente) le operazioni di interpolazione saranno affidate allo shader core; questo perchè dalle dx10.1 in poi sono previsti anche filtri di tipo custom non necessariamente frutto di interpolazione lineare. Ciò comporta l'abbandono delle unità fixed function dedicate nelle tmu per le operazioni di resolve ma non per quelle di texture sampling e texture fetch. La maggior propensione al'effettuazione di calcoli di tipo ff delle alu di GT300 avvantaggerà il chip nVidia nelle operazioni di testure filtering di tipo lineare (terreno in cui, storicamente, nVidia ha sempre avuto un certo margine di vantaggio a livello di potenza di calcolo). Le operazioni di texture fetch e texture sampling sono tra quelle a più alta la tenza ed il loro impatto sull'elaborazione è piuttosto alto; non a caso, ad esempio ATi, da r600 in poi, ha previsto un numero di texture sampling unit di 4 volte superiore rispetto a quello di texture addressing e texture filtering unit. Per queste operazioni è previsto ancora l'uso di fixed function persino su larrabee (dove, invece, pare che si siano abbandonate le fixed function nelle rop's). A detta di Intel, questo tipo di operazioni, se emulato tramite unità programmabili può richiedere fino a 16 cicli di clock per operazioni che le fixed function eseguono in 1 o 2 cicli. In ogni caso, l'adozione di una gestione di centinaia di thread in contemporanea permette di mascherare, oggi, abbastanza bene le latenze delle operazioni di texturing (questo permette di effettuare multitexturing con molti layer senza un hit prestazionale troppo elevato). Per quanto riguarda le rop's, fino alla generazione dx10 erano composta da fixed function per le operazioni relative all'applicazione del MSAA. Già con le dx10.1 si sono adottati filtri di tipo custom e lo stesso succederà con le dx11; sarà da vedere se si deciderà di mantenere, comunque, le unità dedicate alle operazioni di resolve del MSAA box (ovvero con filtraggio di tipo lineare) all'interno delle rop's Ultima modifica di yossarian : 23-11-2009 alle 14:03. |
||
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 20:51.












, son domande che ti poni comunque lecite ma totalmente ot. Vedremo come andrà gt300, e in base a come va valuteremo il mercato delle gpu meglio di come lo stiamo faccendo attualmente. leggendo l'articolo di hw.fr sono un po scettico su tutta sta potenza in ambito videoludico di fermi, spero e mi auguro che non sia cosi........








