View Single Post
Old 04-05-2007, 18:18   #5497
leoneazzurro
Senior Member
 
Iscritto dal: Jan 2003
Messaggi: 10395
Quote:
Originariamente inviato da yossarian Guarda i messaggi
non è improbabile e non sarebbe la prima volta che accade. ATi, ad ogni step (tranne nel passaggio tra R3x0 e R4x0), ha sempre apportato grandi innovazioni ai chip, mentre nVidia utilizza una strategia più conservativa. Ad esempio, NV3x era ancora, per molti aspetti, legato alla "tradizione" dei chip dx7 e dx8 (e non a caso, con lo sm1.x era molto veloce); il salto si è avuto con NV40 di cui G7x è stato un'evoluzione. La filosofia è molto differente: ATi preferisce partire con un'architettura già orientata allo shader model di riferimento, su cui lavorare nei successivi step (ottimizzazioni, aumento delle unità ecc, ma con una base di partenza che, a livello architetturale resta la medesima), nVidia preferisce passare attraverso più fasi di transizione. Il primo approccio premia a medio/lungo termine, il secondo è più gratificante a breve termine (e permette uno sviluppo più rapido delle architetture). Anche se, in effetti, in R6x0 c'è più di qualcosa di R5x0.
A proposito delle similitudini con R580, se non erro anche in quel caso le TU erano riunite in 4 gruppi (con le dovute differenze ). Possiamo quindi ipotizzare che 5*SP di R600 siano quello che per R580 erano le shader unit 2*(vec3+1), adesso in rapporto di 4:1 anzichè 3:1 con le TFU. In realtà bisognerebbe vedere anche come i thread vengono gestiti, in R580 il controllo era gestito se non erro per ogni gruppo di 3 shader unit. In R600 credo dovrebbe essere fatto per ogni cluster di 5 SP, anche se il fatto di avere una struttura "4-4-4-5" immagino indichi uno schema di controllo ben più complesso.
Anche l'"ultrathreaded dispatch processor" nello schema ricorda molto l'omonimo di R580 (anche se la complessità sarà sicuramente superiore)
Guardando lo schema quindi abbiamo 4 blocchi principali da 80 SP, ossia 16 "shader unit" da 5 stream processors. Stando a quanto detto da Yoss, questi 16 gruppi a loro volta sono organizzati secondo una struttura 4x4 (per gestire 4 quads per gruppo, presumo). Ora, in R600 non so se le ogni TU "serva" uno dei 4 blocchi principali oppure siano totalmente ortgonali, ossia ogni TU possa servire tutti e 4 i blocchi. Ma credo che le modalità di accesso siano simili a quelle di R580, pur con le dovute differenze funzionali e al fatto che ora le Shader unit operano anche sui vertici. le ROPS invece credo siano state completamente riviste.
__________________
PC Specialist Recoil 17 - 13900HX - 32 GB DDR5 5200 - Geforce RTX 4080 Mobile 12Gb 175W - 1 SSD Corsair Core XT MP600 2 TB NVMe - 1SSD Solidigm P41+ 2TB NVMe
leoneazzurro è offline