|
|
|
![]() |
|
Strumenti |
![]() |
#121 | ||
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
la apple riesce sempre a dire che il suo nuovo prodotto è 5-10 volte + veloce di qualcos'altro ![]() Quote:
Certo ancora non si può dire perchè le GPGPU sono ancora ad uno stato praticamente embrionale... Però sembrano una tecnologia molto promettente.
__________________
![]() |
||
![]() |
![]() |
![]() |
#122 | |
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
![]() |
![]() |
![]() |
#123 | |
Bannato
Iscritto dal: Jun 2004
Messaggi: 4607
|
Quote:
Da quelli che ho visto io non molto, almeno non necessariamente tutti imputabili all'architettura in-order. Se la semplificazione architetturale permette un innalzamento della frequenze (come nel caso del Cell) che colma il gap di prestazioni, semplicemente si è scelto un approccio diverso al problema, più efficiente dal punto di vista n. transistor/prestazioni, quindi più economico da produrre, ma ugualmente efficiente dal punto di vista prestazionale. Credo che questa sia stata la filosofia di IBM per il Cell. |
|
![]() |
![]() |
![]() |
#124 | |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
![]() scherzi a parte. Per quanto si possa anche utilizzare l'approccio EPIC di Itanium (cosa di cui dubito fortemente sul cell) dovresti sapere che una CPU Out of Order è inerentemente + efficiente, per quante ottimizzazioni possa fare un compilatore. Ora, che tu mi dica che esistano applicazioni in cui una cpu in order e out of order abbiano prestazioni del tutto comparabile nessuno lo mette in dubbio. Ma immagina una situazione magari pesantemente multi-threaded con molteplici accessi alla memoria. In quel caso semplicemente le prestazioni di una CPU in-oder crolleranno, perchè appena trova una banalissima istruzione che richiede accesso alla memoria (una semplice MOV che carichi un registro ad esempio) e il dato non si trova nè nella L1 nè nella L2, allora la CPU si ritroverà a perdere un centinaio di cicli di clock nell'attesa del dato, perchè NON può in nessun modo eseguire le istruzioni successive. Una CPU out of order invece, a meno di problemi di dipendenze, può tranquillamente continuare il suo lavoro mentre attende che il dato venga caricato dalla memoria. Da notare come il modello in-order si adatti particolarmente ad elaborazioni di flussi di dati, ed è principalmente per questo motivo che è stato adottato nel cell (Oltre ovviamente al risparmio derivato dall'architettura è semplificata).
__________________
![]() |
|
![]() |
![]() |
![]() |
#125 | ||
Senior Member
Iscritto dal: Aug 2005
Messaggi: 2052
|
Quote:
Quote:
![]() Sul forum di Beyond3D ci sono tonnellate di informazioni su Ps3, scritte da svariati programmatori di Ps3 e Xbox360. http://forum.beyond3d.com/forumdisplay.php?f=15 Questo thread è particolarmente interessante e non ci sono numeri teorici ma numeri reali. La tech demo a cui mi riferivo prima è stata realizzata in sole 2 settimane da 2 programmatori attraverso questo nuovo tool di sviluppo chiamato Edge. http://forum.beyond3d.com/showthread.php?t=39185&page=4 |
||
![]() |
![]() |
![]() |
#126 | |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
Perchè, come ho detto prima, tale modello è utile soprattutto se utilizzato nell'analisi di flussi di dati (che è proprio l'utilizzo PRINCIPE del cell e per questo IBM ha scelto il modello in-order consentendo una maggiore frequenza per via della maggiore semplicità architetturale).
__________________
![]() |
|
![]() |
![]() |
![]() |
#127 | |
Bannato
Iscritto dal: Jun 2004
Messaggi: 4607
|
Quote:
|
|
![]() |
![]() |
![]() |
#128 | |||
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
![]() Quote:
![]() Partecipò lungamente anke lui alla discussione di diverso tempo fa sul Cell, insieme a me, Yossarian, Cdimauro, Fek (programmatore della LionHead) e tanti altri che non ti sto a nominare che non finiamo + ![]() Quote:
![]() ora gli do un'okkiata ![]()
__________________
![]() |
|||
![]() |
![]() |
![]() |
#129 | |
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
![]() |
![]() |
![]() |
#130 | |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
questo mi ricorda il ring-bus di R520.... o sbaglio? ![]()
__________________
![]() |
|
![]() |
![]() |
![]() |
#131 | |
Bannato
Iscritto dal: Jun 2004
Messaggi: 4607
|
Quote:
Questo: http://www.geekpatrol.ca/2006/11/pla...3-performance/ Ma ora non funziona. E' un benchmark sotto Linux con decine di test... Le differenze sono molte in un verso o nell'altro a seconda del test, ma il risultato è quello... Lo stesso bench su un MacPro (Xeon 2.66 Ghz, credo) dava risultati circa 4 volte superiori, da cui è evidente perchè Apple è passata a quelli... Ovviamente testa solo la PPE del Cell, visto che non include codice per le SPE. |
|
![]() |
![]() |
![]() |
#132 | |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
Il problema non dipende dall'architettura utilizzata. Itanium per limitare in parte il problema utilizzava gli accessi alla memoria in maniera predicativa a livello di codice sorgente, in pratica il programmatore e il compilatore potevano dire quando pensavano che sarebbe avvenuto un accesso alla memoria e il codice sarebbe stato genereato con le istruzioni nell'ordine giusto per limitare i danni. Il problema è però ke quest'approccio statico è molto meno efficiente di quello dinamico calcolato dallo scheduler del processore. E, come ho detto prima, in applicazioni che richiedono molteplicic accessi alla memoria e che siano magari anche multi-threaded la differenza è evidente.
__________________
![]() |
|
![]() |
![]() |
![]() |
#133 | |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
Quote:
se non sappiamo che genere di test sono mi pare difficile analizzare alcunchè ![]()
__________________
![]() |
|
![]() |
![]() |
![]() |
#134 | |
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
![]() |
![]() |
![]() |
#135 | |
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Il principio su cui si basa il ring bus è molto semplice: su un crossbar tradizionale, ogni braccio serve un certo numero di chip di ram. Nel momento in cui una unità di calcolo ha bisogno di accedere alla ram, l'arbiter riceve la richiesta di accesso, ne valuta la priorità (insieme alle altre richieste pervenute), la invia al chip a cui è stato chiesto di accedere e quindi procede all'evasione della richiesta. In pratica, segue tutto il processo, ad esempio, di trasferimento dati da e verso la ram (che si può dividere in 4 fasi). Con il ring bus, invece, una volta che il controller ha ricevuto la richiesta e l'ha inoltrata viene reso libero di passare ad elaborare altre richieste; supponiamo che si debba trasferire dei dati da un chip di ram verso un'unità di calcolo, questi sono messi in circolo all'interno del ring (ovviamente il pacchetto contiene anche l'informazione relativa alla alu o pipeline che deve farne uso); una volta che il pacchetto arriva in corrispondenza dell'unità che ne ha fatto richiesta, viene automaticamente smistato senza ulteriori interventi da parte del controller. Ovvio che anche una struttura ad anello presenta dei punti deboli e, all'aumentare del numero di unità di calcolo o di chip di ram, rischia di perdere efficienza (questo è uno dei motivi per cui nei chip ATi, le unità sono sempre raggruppate in cluster di 12, 16, ecc, alu). Invece, ad essere multithreaded è la singola pipeline (o la singola alu) Ultima modifica di yossarian : 17-03-2007 alle 18:29. |
|
![]() |
![]() |
![]() |
#136 |
Senior Member
Iscritto dal: Jun 2002
Messaggi: 15252
|
E dimmi quando pensate di farci vedere l'R600?(
![]()
__________________
Boris Strugatskij - Arkadij Strugatskij : Picnic sul ciglio della strada ![]() |
![]() |
![]() |
![]() |
#137 |
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
siamo pericolosamente OT
![]() |
![]() |
![]() |
![]() |
#138 |
Senior Member
Iscritto dal: Jun 2002
Messaggi: 15252
|
Ops (
![]()
__________________
Boris Strugatskij - Arkadij Strugatskij : Picnic sul ciglio della strada ![]() |
![]() |
![]() |
![]() |
#139 |
Member
Iscritto dal: Sep 2006
Messaggi: 41
|
ottima novità, perché non partecipano anche le altre consolle al progetto? sarebbe bellissimo, immaginate come si accorcerebbero i tempi di ricerca.
p.s. comunque volendo butterei dentro anche i comunic pc. |
![]() |
![]() |
![]() |
#140 | |
Senior Member
Iscritto dal: Jan 2002
Città: non ti interessa
Messaggi: 5644
|
Quote:
Come al solito c'è sempre chi legge una cosa e poi parte per la tangente facendo connessioni in lungo e in largo. Ti rendi conto di quello che TU pensi che IO sia contro la ricerca? Dov'è che ho scritto "sono contro la ricerca"? Trovamelo dai, ti do' 1000 euro. Ti rendi conto che io stavo commentando solo e soltanto la notizia e i riflessi pubblicitari per sony, e non ho mai detto nulla sulla bontà di folding@home? Bah... probabilmente sono solo parole sprecate... |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 14:04.