|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#9081 | |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 7819
|
Quote:
__________________
Sample is selezionated !
|
|
|
|
|
|
#9082 | |
|
Senior Member
Iscritto dal: Jan 2006
Messaggi: 4414
|
Quote:
Certo, il mio discorso vale a parità di architettura: è ovvio che un chip "magico" e ultracompatibile che facesse la ripartizione del carico tra due GPU sarebbe preferibile ai driver di oggi che lo fanno, ma se questo chip potesse esistere, esisterebbe anche un driver in grado di farlo, magari non alla stessa velocità. Il discorso dell'architettura vliw non mi sembra molto attinente alla ripartizione del carico tra GPU.
__________________
flìckr |
|
|
|
|
|
#9083 | ||
|
Senior Member
Iscritto dal: Feb 2002
Città: Firenze
Messaggi: 2434
|
Quote:
Quote:
R600 è dotato di 4 cluster, questo implica che il compiler dovrebbe riuscire in una situazione ottimale, in ogni ciclo (anzi ogni 4 cicli, credo, avendo R600 branching granularity di 64 threads), ad assemblare 4 macroistruzioni da "dare in pasto" ad ognuno dei 4 cluster (ognuna delle quali, in un mondo perfetto, sarebbe composta da 5 istruzioni scalari). Ora abbiamo visto che il compilatore già così fa una fatica immane perchè deve comunque evitare le dipendenze tra istruzioni nell'assemblare le VLIW. Ora, in Rv770 invece di incrementare il numero di sp per cluster (come molti si aspettavano) , hanno incrementato il numero dei cluster da 4 a 10 (penso per migliorare le prestazioni nel dynamic branching): questo dovrebbe aver reso il lavoro di parallelizzazione del compiler molto più difficile, eppure le prestazioni non sembrano risentirne minimamente. Hai qualche informazione a riguardo? Un'altra cosa: cos'è il vertex texturing? Anche per me pochissime. Anche perchè dalle prime foto R700 sembra comunque composto da due package.
__________________
"The same people who call Bitcoin a bubble are $35 trillion in debt." |
||
|
|
|
|
#9084 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Il driver è più lento e, poichè quanti livelli di logica ci sono, tanto più aumentano i cicli sottratti ad operazioni non finalizzate al calcolo puro e semplice, avere operazioni gestite da HW preposto a quel compito, anzichè da SW che deve essere ottimizzato per farlo velocizza le cose. Inoltre un HW programmato a basso livello è trasparente al codice a livello più alto, il che significa che non può essere influenzato da errori nella programmazione o da eventuali conflitti. Infine, l'ottimizzazione via driver di architetture sempre più complesse comporta notevole dispendio di energie con risultati non sempre all'altezza. L'esempio dell'architettura vliw serviva a richiamare l'attenzione sui problemi di R6x0 che è parzialmente vliw; il bilanciamento dei carichi tra gruppi di unità e gli accessi alla ram, gestiti da controller HW non hanno dato nessun problema. La gestione del parallelismo delle alu di tipo vliw, invece, che doveva essere affidata ad un compilatore (e quindi doveva avvenire via SW) ha creato notevoli problemi) |
|
|
|
|
|
#9085 | ||
|
Senior Member
Iscritto dal: Jan 2006
Messaggi: 4414
|
Quote:
A differenza delle CPU, per cui il multi-core è l'unico modo per poter progredire oggigiorno a causa di vincoli tecnologici, il "multi gpu" è una scelta solo per contenere i costi di progettazione. Non capisco molto il discorso di "multi-gpu on-die", non è più efficiente un'architettura modulare che si possa ingrandire a piacere con il copia&incolla nel CAD, piuttosto che livelli di controller in cascata? Quote:
Non credo che un compilatore VLIW hardware (o accelerato via hardware) sarebbe più efficace di uno software. L'idea delle architetture VLIW è di spostare il lavoro sul software (lavoro che tra l'altro non ha vincoli di velocità, visto che la compilazione non avviene in tempo reale) per semplificare l'hardware. Io non riesco a vedere questo come prova che "software è inerentemente peggio - o meno affidabile - di hardware" anzi, il compilatore software puoi aggiornarlo...
__________________
flìckr |
||
|
|
|
|
#9086 |
|
Senior Member
Iscritto dal: Sep 2007
Città: Prov. Catania
Messaggi: 783
|
edit
Ultima modifica di NicKonsumaru : 20-06-2008 alle 18:12. |
|
|
|
|
#9087 |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 7819
|
yoss quale limite di RV670 bisogna superare per far si che una scheda con 2 gpu in 2 distinti package sullo stesso pcb non sia più un crossfire su singola scheda come lo è ora la 3870X2 ?
__________________
Sample is selezionated !
|
|
|
|
|
#9088 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Per quanto riguarda il branching l'avere 10 gruppi da 80 alu (16*5) avrebbe aumentato le dimensioni delle batch se si fosse mantenuto lo stesso algoritmo usato per R600 (16*10 invece di 16*4). il vertex texturing è la possibilità di fare texture fetch anche da parte deille unità di vertex shading (con le architetture unificate questa distinzione non ha più senso), introdotta con lo sm3.0 con R700 nessuna |
|
|
|
|
|
#9089 |
|
Bannato
Iscritto dal: May 2004
Città: Sicily™ Trattative:Innumerevoli
Messaggi: 20620
|
|
|
|
|
|
#9090 |
|
Senior Member
Iscritto dal: Jun 2005
Città: Vitória(ES), Brasile
Messaggi: 8152
|
Si, l' ha detto
![]() Sono quasi crepato all'istante
__________________
Se la vita ti da limoni ... Spremili in occhio a qualcuno e corri! |
|
|
|
|
#9091 |
|
Bannato
Iscritto dal: Mar 2007
Città: Ex Vrbe
Messaggi: 3924
|
|
|
|
|
|
#9092 |
|
Senior Member
Iscritto dal: Feb 2000
Messaggi: 11168
|
Un saluto a Yoss è sempre un piacere leggere le sue disamine
E grande ATI
__________________
PC 1 : |NZXT 510i|MSI PRO Z690 A|I5 [email protected] Ghz (Pcore) 4.5 Ghz (Ecore)|AIO ENDORFY NAVI F280|32 GB BALLISTIX 3600 cl 14 g1|GIGABYTE 4070 SUPER AERO OC|RM850X|850 EVO 250|860 EVO 1TB|NVMe XPG-1TB||LG OLED C1 - 55 | PC 2 : |Itek Vertibra Q210|MSI PRO B660M-A|I5 12500|32 GB KINGSTON RENEGADE 3600|ARC A770 LE 16 Gb|MWE 750w| ARC 770 LE 16 Gb Vs RTX 3070 - CLICCA QUI |
|
|
|
|
#9093 | |||
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Quote:
Un'architettura modulare è più efficiente fino ad un certo livello di complessità, a patto di non rendere troppo macchinose le comunicazioni tra le varie gpu; e comunque, anche un'architettura multigpu o multicore che dir si voglia, da un certo livello di complessità in poi non può più essere gestita via SW (vedi, ad esempio, il cell, la cui gestione interna non avviene via SW ed è un controller HW a gestire i dma dei spe e gli stessi dma sono inizializzati dal ppe: il tutto in maniera trasparente rispetto al SW). Quote:
Anche i controller HW possono essere "aggiornati" se sono programmabili; però, se permetti, non si può accettare l'idea che un dispositivo "critico" per il funzionamento di un chip, come un controller, possa essere programmato ad alto livello via driver, magari da persone che neppure conoscono alla perfezione l'architettura del chip Ultima modifica di yossarian : 20-06-2008 alle 18:28. |
|||
|
|
|
|
#9094 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
|
|
|
|
#9095 | |
|
Senior Member
Iscritto dal: Jul 2005
Messaggi: 7819
|
Quote:
Kyle Bennett di HardOcp a Dicembre 2007 aveva detto che ingegneri ATi gli avevano detto che R700 non sarebbe stato un crossfire... ce lo spiegherai tra un po
__________________
Sample is selezionated !
|
|
|
|
|
|
#9096 | ||
|
Senior Member
Iscritto dal: Jan 2002
Città: Napoli
Messaggi: 2389
|
Quote:
Quote:
Sono sicuro della sua innocenza... Cmq sono felice che questo 3d abbia preso una piega più "tech" e didattica... |
||
|
|
|
|
#9097 |
|
Senior Member
Iscritto dal: Aug 2005
Messaggi: 2052
|
![]() Oddio, RV770 è vivo! E' consapevole di essere una chip grafico XD |
|
|
|
|
#9098 |
|
Senior Member
Iscritto dal: Jan 2004
Messaggi: 9409
|
|
|
|
|
|
#9099 | |
|
Senior Member
Iscritto dal: Aug 2005
Messaggi: 2052
|
Quote:
http://forum.beyond3d.com/showpost.p...postcount=4284 |
|
|
|
|
|
#9100 |
|
Senior Member
Iscritto dal: Aug 2005
Messaggi: 2052
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 20:03.





















