View Full Version : Flops
Morpheus_/_Neo
17-10-2003, 17:30
raga quanti MegaFlops fanno le seguenti cpu?
G4, G5, Pentium 4, Xeon, AthlonXP, tutti i derivati dell'Hammer?
PS: avete visto la notizia sulla sezione Internet del sito www.corriere.it ?
parlano di una cpu da 25 gigaflops a prezzi umani (credo significhi a portata aziendale)... che ne dite?
Originariamente inviato da Morpheus_/_Neo
raga quanti MegaFlops fanno le seguenti cpu?
G4, G5, Pentium 4, Xeon, AthlonXP, tutti i derivati dell'Hammer?
Dipende da molti fattori, dal codice, dalla definizione di flop, dalla precisione utilizzata, ecc..
Cmq non più di 12,5, 16, 12,8, 12,8, 9,33, 8,8 (GF).
PS: avete visto la notizia sulla sezione Internet del sito www.corriere.it ?
No
parlano di una cpu da 25 gigaflops a prezzi umani (credo significhi a portata aziendale)... che ne dite?
Bho
Originariamente inviato da ev8
Dipende da molti fattori, dal codice, dalla definizione di flop, dalla precisione utilizzata, ecc..
Cmq non più di 12,5, 16, 12,8, 12,8, 9,33, 8,8 (GF).
Come fai a dare questi risultati???
cioè, l'hammer avrebbe la metà della potenza di calcolo di un g5???:confused:
Originariamente inviato da Zac 89
Come fai a dare questi risultati???
1,25*10, 2*8, 3,2*4, 3,2*4, 2,33*4, 2,2*4
cioè, l'hammer avrebbe la metà della potenza di calcolo di un g5???:confused:
Con il codice usato nei comuni programmi no (hanno velocità simili); in un'ipotetica situazione in cui le FPU vengono sfruttate al 100% si.
Cecco BS
18-10-2003, 19:41
no... ho perso il segno... ev8, puoi spiegarti meglio??? :confused: :confused: :muro:
Originariamente inviato da Cecco BS
no... ho perso il segno... ev8, puoi spiegarti meglio??? :confused: :confused: :muro:
Usando numeri in virgola mobile a 32bit, il G4 può istanziare 5FMAC(d=a*b+c) (1 con l'FPU e 4 con la VPU) contemporaneamente; il G5 4 (nella VPU logica); i pentium 4 eseguono 4addizioni o 4moltiplicazioni contemporanee (SSE) mentre le cpu AMD eseguono 2somme e 2prodotti (usando entrambe le FPU).
EV8: e l'unità SSE2 di AMD ? L'unità SSE si trova all'interno delle unità FP, ma quella SSE2 è esterna...
Originariamente inviato da cionci
EV8: e l'unità SSE2 di AMD ? L'unità SSE si trova all'interno delle unità FP, ma quella SSE2 è esterna...
Le SSE2 riguardano i calcoli in doppia precisione, io parlavo di quelli in singola precisione, per ottenere il massiomo numero di operazioni/s.
I calcoli 3DNOW, SSE ed SSE2 vengono eseguiti tutti all'interno delle solite 3FPU dell'athlon, non esistono unità di calcolo aggiuntive per le SSE2.
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25112.PDF
Cecco BS
20-10-2003, 15:16
ommaddonna... aspetto che mi passi il mal di testa poi proverò a leggere con più attenzione... mi fa lo stesso effetto quando leggo le guide di lithium... :D :D :muro:
jappilas
22-10-2003, 22:32
credo di aver capito a cosa si riferiva Morpheus / Neo ... ;)
cioè all' annuncio di ClearSpeed Technologies... http://www.clearspeed.com/
che riguarda un coprocessore per i calcoli FPU realizzato su topologia vettoriale (come le unità AltiVec, le SSE, e prima i supercomputer) che si potrebbe avere su una cheda PCI ... dai "white paper" sul sito sembra che potrebbero stare 4 di questi processori per ogni scheda, 6 schede in un pc, per complessivi 600 GFlops... il prezzo però sarebbe sui 25.000 $...
:rolleyes:
(vedere anche "headline" e articolo linkato su www.osnews.com )
Si ma il CS301 non è una CPU general purpose, è un processore ALTAMENTE vettoriale, ed estremamente spartano nell'architettura per ottenere il massimo di Float/s... ovvero, lo si usa quando se ne ha bisogno (per particolari applicazioni) ed è parecchio inefficente nell'eseguire il codice dei programmi che si usano tutti i giorni (quanti cicli hanno più di 128operazioni simultanee in virgola mobile e non fanno richiesta di dati sul FSB?).
Morpheus_/_Neo
23-10-2003, 13:01
scusate, ma non si era sempre detto che le fpu degli athlon erano delle bombe? e allora com'e' che un p4 disintegra un xp come flops? e qual e' la differenza tra un p4 e uno Xeon visto che prestazionalmente sembrano non esserci differenze?
PS: scusate l'ignoranza
Originariamente inviato da Morpheus_/_Neo
scusate, ma non si era sempre detto che le fpu degli athlon erano delle bombe? e allora com'e' che un p4 disintegra un xp come flops?
Il calcolo dei FLOPS non è sempre indicativo delle prestazioni reali...
Originariamente inviato da Morpheus_/_Neo
e qual e' la differenza tra un p4 e uno Xeon visto che prestazionalmente sembrano non esserci differenze?
Nessuna...solo il supproto multi-processore e la quantità di cache...
Originariamente inviato da Morpheus_/_Neo
scusate, ma non si era sempre detto che le fpu degli athlon erano delle bombe? e allora com'e' che un p4 disintegra un xp come flops? e qual e' la differenza tra un p4 e uno Xeon visto che prestazionalmente sembrano non esserci differenze?
PS: scusate l'ignoranza
Le unità in virgola mobile degli Athlon sono potenti ma chiaramente non possono competere con unità SIMD vettoriali quale quella che processa le SSE2 nei P4.
Gli Xeon adottano un package differente e possono avere tagli di cache diversi dai normali P4 (anche se il P4EE ha cache L3 come uno Xeon MP), oltre al fatto che possono essere utilizzati in configurazioni dual (i modelli DP) o più (i modelli MP). Tutti i piedini in più assicurano una alimentazione più stabile e segnali di controllo supplementari.
Ciao
Federico
Perfectdavid
23-10-2003, 16:23
in potenza pure i p4 sono superiori agli xp.
Solo per l'unità SSE...se si va a vedere solamente i FP non si scampa...
Cecco BS
23-10-2003, 17:10
Originariamente inviato da flisi71
Le unità in virgola mobile degli Athlon sono potenti ma chiaramente non possono competere con unità SIMD vettoriali quale quella che processa le SSE2 nei P4.
Gli Xeon adottano un package differente e possono avere tagli di cache diversi dai normali P4 (anche se il P4EE ha cache L3 come uno Xeon MP), oltre al fatto che possono essere utilizzati in configurazioni dual (i modelli DP) o più (i modelli MP). Tutti i piedini in più assicurano una alimentazione più stabile e segnali di controllo supplementari.
Ciao
Federico
...e anche l'emulazione dei 36 bit...
Originariamente inviato da Cecco BS
...e anche l'emulazione dei 36 bit...
Parli del PAE ?!?!?! Ma quello c'è anche nei P4 ;)
Cecco BS
23-10-2003, 18:05
davvero? Quindi potrei usare oltre 4 gb di memoria col mio sistema (se trovassi dimm da 2 gb... e se mi servissero 8 gb di memoria... ehm...)??
Dipende anche dal chipset se lo supporta...non credo che i chipset P4 commerciali lo supportano... In ogni caso la feature c'è anche nel P4 (altrimenti le differenze fra P4 e Xeon sarebero state architetturalmente notevoli)...
I chipset desktop di intel possono indicizzare al massimo 3.5 gb di memoria (anche se si mettono 4gb ne vengno usati al massimo 3.5)
Cecco BS
25-10-2003, 12:44
a quanto ne so - correggetemi se sbaglio - nei p4 l'unità FP è meno potente rispetto a quella degli Athlon o dei Pentium III perchè è stato preferito sacrificare transistor per rendere più potente l'unità SSE2, giusto?
Originariamente inviato da ev8
Dipende da molti fattori, dal codice, dalla definizione di flop, dalla precisione utilizzata, ecc..
Cmq non più di 12,5, 16, 12,8, 12,8, 9,33, 8,8 (GF).
No
Bho
Ev8 come mai a 2,2GHz dai l'Athlon come più performante rispetto all'Hammer?
E come mai quando spieghi come calcoli i GFlop in pratica moltiplichi per 2 le operazioni / ciclo (es: dici che un Athlon può fare 4 operazioni al secondo però poi riporti nel tuo calcolo 2,2(frequenza) * 8 (suppongo le operazioni / ciclo).
Scusa le domande ma non sono molto ferrato in materia. :)
CIAO! :)
Cecco BS
25-10-2003, 14:22
uppete! uppete! uppete!! Questa discussione mi ispira un casino...
zannabia
25-10-2003, 14:34
finalmente qualcosa di stimolante in discussione:)
Cecco BS
25-10-2003, 14:41
giàggiàgggià... dai ev8 spiegaci la storia dei megaflops... siamo ansiosi di sapere... :D
Originariamente inviato da Cecco BS
a quanto ne so - correggetemi se sbaglio - nei p4 l'unità FP è meno potente rispetto a quella degli Athlon o dei Pentium III perchè è stato preferito sacrificare transistor per rendere più potente l'unità SSE2, giusto?
Dipende da come la si usa. Praticamente l'athlon nacque per eseguire codice x87 ( numeri in virgola mobile ad 80bit ) il più velocemente possibile, il Pentium 4 invece nasce per eseguire SSE/SSE2, e , solo in seconda istenza il vecchio x87. Per questo, con i vecchi programmi in virgola mobile che usano ancora i numeri ad 80bit l'athlon è decisamente superiore ( 2operazioni per ciclo ) al pentium 4 ( 1operazione per ciclo ). Con SSE/SSE2 il discorso è ben diverso: l'athlon riesce a raggiungere il pentium 4 in prestazioni solo grazie alla sua maggiore efficenza ed una pipeline corta la metà.
I pentium 3 sono meno potenti a 64bit ma sono più efficenti grazie alla pipeline a soli 10stadi.
Originariamente inviato da shodan
Ev8 come mai a 2,2GHz dai l'Athlon come più performante rispetto all'Hammer?
Non lo do.
Ho considerato l'athlon XP@2,33GHz, l'athlon64FX@2,2GHz.
I calcoli da mè fatti sono puramente teorici, le performance pratiche di un athlon 64 sono superiori a quelle di un athlon xp grazie maggior numero di registri logici.
http://www.aceshardware.com/SPECmine/index.jsp?b=2&s=1&v=4&if=0&cf=0&cf=1&cf=2&cf=3&cf=4&cf=5&cf=6&r1f=2&r2f=0&m1f=0&m2f=0&o=0&o=1&o=2&ic=0&ic=2&ic=4&ic=5
177.mesa e 200.sixtrack danno un'idea del calcolo in FPU.
E come mai quando spieghi come calcoli i GFlop in pratica moltiplichi per 2 le operazioni / ciclo (es: dici che un Athlon può fare 4 operazioni al secondo però poi riporti nel tuo calcolo 2,2(frequenza) * 8 (suppongo le operazioni / ciclo).
Ho moltiplicato 2,2*4, non 2,2*8, come dal mio post precedente.
Scusa le domande ma non sono molto ferrato in materia. :)
CIAO! :)
Originariamente inviato da ev8
Non lo do.
Ho considerato l'athlon XP@2,33GHz, l'athlon64FX@2,2GHz.
I calcoli da mè fatti sono puramente teorici, le performance pratiche di un athlon 64 sono superiori a quelle di un athlon xp grazie maggior numero di registri logici.
http://www.aceshardware.com/SPECmine/index.jsp?b=2&s=1&v=4&if=0&cf=0&cf=1&cf=2&cf=3&cf=4&cf=5&cf=6&r1f=2&r2f=0&m1f=0&m2f=0&o=0&o=1&o=2&ic=0&ic=2&ic=4&ic=5
177.mesa e 200.sixtrack danno un'idea del calcolo in FPU.
Ho moltiplicato 2,2*4, non 2,2*8, come dal mio post precedente.
Che dire...
grazie delle info e del link! :)
CIAO! :)
Originariamente inviato da Conner
Se la memoria non m'inganna la struttura K7 prevede 3 unità FPU full due geeneriche ed una specifica per i calcoli complessi.
Nel'FPU le pipe sono dedicate rispettivamente a: somme/sottrazioni, moltiplicazioni/divisioni, load/store. In sostanza, solo le prime due pipe eseguono dei veri calcoli in virgola mobile, la terza è più che altro di supporto ed esegue operazioni particolari.
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25112.PDF
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.