|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#13101 | |
|
Senior Member
Iscritto dal: Oct 2005
Messaggi: 3657
|
Quote:
|
|
|
|
|
|
#13102 |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
edit doppio
Ultima modifica di yossarian : 06-01-2010 alle 13:29. |
|
|
|
|
#13103 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Questo significa che può mandare in esecuzione 2 thread differenti su 2 diversi gruppi di 16 alu. Questo non significa che una singola alu può eseguire 2 thread in parallelo. Mi spiego meglio: in G80 e GT200, ogni SP può eseguire una istruzione per volta (è un processore di tipo SIMD); questo significa che tutte e 16 le alu di g80 o tutte e 24 quelle di gt200 eseguono la stessa istruzione nello stesso ciclo. In fermi, ogni SP raggruppa 32 alu ma contiene 2 warp scheduler. Un warp equivale a 32 thread. Questo significa che, contrariamente a g80 e gt200, in cui veniva mandato in esecuzione un warp per ogni SP, in fermi si pososno mandare in esecuzione 2 warp per SP, ossia un gruppo di 16 alu può eseguire un'istruzione differente dall'altro gruppo. Questo serve soprattutto epr le operazioni a granularità più fine. Per esempio, se un'operazione richiede un'esecuzione fortemente parallela della stessa istruzione, il vantaggio di avere 2 warp scheduler diventa pari a 0. In ogni caso, in ciascuna architettura, la singola alu può eseguire una sola istruzione per ciclo. |
|
|
|
|
|
#13104 |
|
Member
Iscritto dal: Nov 1999
Messaggi: 186
|
Ma da un punto di vista gaming, visto che le Geforce sono rivolte a questo ambito, che vantaggi può dare avere 2 warp scheduler?
Immagino sia tutta una questione di come i driver riescano a gestire il flusso dati, in maniera da ottimizzare il "parallelismo". A meno che non mi sbagli del tutto, e che i giochi siano altamente parallelizzabili. Ma mi sembrerebbe quantomeno difficile. Questo per l'alta correlazione tra istruzioni. A questo punto mi viene in mente un'altra domanda. Cioè, se la correlazione non mi consente di sfruttare i 2 warp scheduler, come si comporta il chip? Immagino che un gruppo di 16 alu lavora a pieno ritmo, ma l'altro? Succede che la Geforce lavora a metà della sua potenza nel worst case? |
|
|
|
|
#13105 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
In quanto alla gestione, bisogna considerare il warp scheduler come un'estensione del thread processor principale. E' il thread processor che decide quali warp inviare ed a quale cluster. Questo implica che se il thread processor invia la stessa sequenza di istruzione ad entrambi i warp scheduler, su ciascun gruppo di 16 alu gireranno le stesse istruzioni come se ci fosse un unico warp scheduler. Diciamo che averne 2 rappresenta un vantaggio in determinate condizione e non costituisce un handicap nelle altre. |
|
|
|
|
|
#13106 |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2544
|
scusa, magari fra le righe l'hai già detto ma fai qualche esempio in che determinate situazioni potrebbe tradursi in un vantaggio?
intendo "Diciamo che averne 2 rappresenta un vantaggio in determinate condizione" in questo pezzo qui
__________________
[CM Cosmos Pure] [GIgabyte Z77 X-UP7] [i7 2600K@4,2 Ghz cooled by COrsari H110] [4x2Gb Crucial Ballistic 8-8-8-24] [Radeon R9 290] [SO Crucial M4 120Gb; Games WD Caviar Black 1Tb; Storage WD Caviar Green 2Tb] [Asus Xonar D2X] [Creative Gigaworks T40 II] [Windows 7 Professional SP1 64bit] [Logitech G15] [Logitech G9x] |
|
|
|
|
#13107 | |
|
Senior Member
Iscritto dal: Oct 2005
Messaggi: 38298
|
Quote:
__________________
Corsair 5000D - Ryzen 7 7700 - Asrock B650E PG - 2x16gb G.Skill Trident Z5 ddr5 6000 mhz - GeForce Rtx 4070Ti S. - Samsung 980 pro 1tb + Crucial mx500 1tb + WD 1tb - Corsair rm850w - LG oled C4 48 le vga che ho avuto |
|
|
|
|
|
#13108 | |
|
Senior Member
Iscritto dal: Dec 2003
Città: ROMA
Messaggi: 8536
|
Quote:
Gia con una GTX285 si gioca benissimo anche in full HD con i filtri attivi e, per i più esigenti, una 295 svolge perfettamente il suo compito. Tutta questa continua ricerca di potenze mostruose sulle nuove GPU la ritengo, a mio modesto parere, abbastanza inutile, soprattutto considerando che da un bel pò di tempo l'hardware è nettamente avanti al software e prima che possano uscire giochi tali da mettere letteralmente in ginocchio le schede video attuali, ce ne vuole. Ovviamente anche io auspico che Fermi sia potente (e mi sorprenderebbe il contrario) ma quand'anche avessero deciso di orientare le loro attenzioni sul GPGPU che non sul gaming, non mi strapperei i capelli (anche perchè sono calvo
__________________
CASE : TJ07 MOBO : C8DH X570 CPU : Ryzen 9 5950X DISSI : NH-D15s RAM : 32 GB TridentZ Neo 3600 MHz CL14 VGA : RTX 4090 F.E. HDD : 980 Pro + 950 Pro + 870 Evo AUDIO : SB ZX | Yamaha 5.1 YHT-4910 MONITOR : LG 32" IPS 32UN650 POWER : HX1000i Internet : FTTH TIM 2.5/1 Gbps |
|
|
|
|
|
#13109 | |
|
Messaggi: n/a
|
Quote:
|
|
|
|
#13110 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Ultima modifica di yossarian : 06-01-2010 alle 14:48. |
|
|
|
|
|
#13111 |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2544
|
grazie!
__________________
[CM Cosmos Pure] [GIgabyte Z77 X-UP7] [i7 2600K@4,2 Ghz cooled by COrsari H110] [4x2Gb Crucial Ballistic 8-8-8-24] [Radeon R9 290] [SO Crucial M4 120Gb; Games WD Caviar Black 1Tb; Storage WD Caviar Green 2Tb] [Asus Xonar D2X] [Creative Gigaworks T40 II] [Windows 7 Professional SP1 64bit] [Logitech G15] [Logitech G9x] |
|
|
|
|
#13112 |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
aggiungo che l'idea del doppio scheduler nasce anche dalla necessità di semplificare l'organizzazione interna del chip e l'accesso alle risorse. Ad esempio, in RV870, ATi ha introdotto un commando processor e fa uso di 2 thread processor, uno per ogni blocco di 10 SM (o cluster). In pratica, ha, di fatto, raddoppiato l'architettura di RV770 introducendo un nuovo livello di logica (ossia un processore che organizza e smista il lavoro tra i due core RV770).
In fermi, nVidia ha adottato un'architettura con 32 alu per SM il che aumenta la granularità rispetto a GT200 e G80 (in ATi per ogni cluster, si hanno sempre 16 alu). Questo significa che le operazioni che richiedono una granularità più fine risulterebbero penalizzate su fermi. D'altro canto, utilizzare la stessa granularità di G80 (18 per SM) avrebbe comportato la presenza di 32 SM il che inizia a creare più di qualche problema nella gestione dell'accesso alle risorse ed con particolare riferimento alla gerarchia delle ram. Quindi, il doppio scheduler è una soluzione per ridurre, quando occorre, la granularità, senza introdurre problemi nell'accesso alle memorie o nello scambio di dati tra thread. |
|
|
|
|
#13113 |
|
Senior Member
Iscritto dal: Feb 2008
Città: Trieste
Messaggi: 2431
|
mi iscrivo alla discussione perchè anche io devo cambiare vga ^^
__________________
trattative positive con: foreman (3), massimou88, abcorbulo, ilsolvente, aguex, cappellone, scupetta, ginko95, devilmen84, Xeon3540, kajika83, devilmen84, crockett87, g.harrison90, Nayr, eNGy334, Pippowsky, Reverbero, HAVOC, Compulsion, veltosaar, sinergine (2), massimo3550, Gio_87, M4rko, A13X, Aryan, grean, nemini ed un altro utente di cui non ricordo il nome. TechStation.it |
|
|
|
|
#13114 | |||
|
Senior Member
Iscritto dal: Oct 2005
Messaggi: 38298
|
Quote:
credevo si capisse al volo Quote:
Quote:
__________________
Corsair 5000D - Ryzen 7 7700 - Asrock B650E PG - 2x16gb G.Skill Trident Z5 ddr5 6000 mhz - GeForce Rtx 4070Ti S. - Samsung 980 pro 1tb + Crucial mx500 1tb + WD 1tb - Corsair rm850w - LG oled C4 48 le vga che ho avuto |
|||
|
|
|
|
#13115 |
|
Bannato
Iscritto dal: Oct 2009
Messaggi: 6442
|
|
|
|
|
|
#13116 | |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2905
|
Quote:
Quotone anche da parte mia!
__________________
acquistato con soddisfazione da: SHIVA>>LuR<< Jokerpunzk,Markenforcer,vkbms, campioni del mondo,mstella. Venduto a: maxVi, gabrieletor, banaz, tdm70, raxxo, frantheman |
|
|
|
|
|
#13117 |
|
Senior Member
Iscritto dal: Sep 2003
Città: Barcellona
Messaggi: 3550
|
Per "granularitá piú fine" intendi operazioni piú parallelizzabili? L'evoluzione non va verso la parallelizzazione?
__________________
Asus Rog Maximus IX Apex, Intel i7 7700k, 32Gb G.Skill F4-3200C14D-32GVK |
|
|
|
|
#13118 |
|
Senior Member
Iscritto dal: May 2004
Città: Erchie
Messaggi: 6927
|
|
|
|
|
|
#13119 |
|
Messaggi: n/a
|
|
|
|
#13120 |
|
Senior Member
Iscritto dal: Sep 2007
Città: napoli city
Messaggi: 1315
|
quoto pure io
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 18:14.


















