PDA

View Full Version : AMD Opteron a 16 core: i primi benchmark online


Redazione di Hardware Upg
23-03-2011, 11:18
Link alla notizia: http://www.businessmagazine.it/news/amd-opteron-a-16-core-i-primi-benchmark-online_36000.html

Appaiono online i primi benchmark, in ambiente Linux, di un sistema dual socket dotato di processori Opteron Interlagos, ciascuno con 16 core a 1,8 GHz di clock

Click sul link per visualizzare la notizia.

bjt2
23-03-2011, 11:33
C'è da dire che dovrebbero essere engineering sample con turbo disattivato e molto probabilmente frequenza inferiore (e di molto) alla frequenza di uscita. Tanto per dire, il modello top di gamma a 16 core dovrebbe avere frequenza di almeno 2.3Ghz (per alcune dichiarazioni di Cray che intende sostituire i magny cours a 2.3 GHz con Bulldozer a 16 core con frequenza identica), ma molto probabilmente almeno 2.5GHz. Per dichiarazioni ufficiali di John Frueue sul suo blog ufficiale ospitato sul sito AMD, un bulldozer a 16 core ha un turbo core di 500 MHz anche con 16 cores occupati. Da altre stime si deduce che in un carico intero tipico un core assorbe circa il 63% del TDP massimo e che in tali casi il turbo entra in funzione. 500MHz sono il 28% di 1800MHz e considerando la non linearità di crescita della potenza assorbita al crescere della frequenza (che è compresa tra una dipendenza lineare ed esponenziale, con una buona approssimazione di dipendenza cubica) sembra un clock troppo basso per consentire, con un 59% di margine di TDP (bisogna aggiungere il 59% a 63 per arrivare a 100) di salire di 500MHz che è il 28%, considerando anche che AMD garantisce di non superare il TDP in tutte le condizioni e quindi si deve prendere anche un po' di margine...

Sapo84
23-03-2011, 11:55
considerando la non linearità di crescita della potenza assorbita al crescere della frequenza (che è compresa tra una dipendenza lineare ed esponenziale, con una buona approssimazione di dipendenza cubica)
You lost me.
La crescita di potenza non dovrebbe essere lineare con la frequenza e al quadrato con il voltaggio di alimentazione? :mbe:
In ogni caso bisognerebbe valutare se il voltaggio viene toccato durante il turbo o no, nel caso non lo sia non escluderei che quell'aumento di frequenza sia possibile.

Detto questo nella pagina del benchmark vengono indicati 2 processori a 16 core, quindi 32 core totali.
Direi che c'è una bella differenza tra fare 26 secondi con 16 core e farlo con 2 processori da 16 core.
A seconda dello scaling del benchmark direi che il risultato a singola cpu potrebbe essere intorno ai 50 secondi.

iorfader
23-03-2011, 12:05
be mi ricordo ancora gli opteron veccho stile:D questi 16 core sono esagerati:O

devil_mcry
23-03-2011, 12:15
sarebbe più interessante sapere quanto faceva un thuban per avere un confronto tra vecchio e nuovo

robertino75
23-03-2011, 12:42
ammetto di essere molto ignorante in materia e quindi mi sfugge una cosa...quando si parla di 16 core si intendono proprio 16 core o 16 thread?
poi se non ho capito male il "confronto" è tra 32 core(o thread)e 4 core(8thread) dell'i7 950?

HSMD
23-03-2011, 12:44
Sembra molto (un po' troppo forse) un esercizio di stile. Voglio dire, 2 sample a 16 core, per un totale di 32 core, 64 giga di ram :sofico: ci credo che ha fatto il record di 26 secondi. Piu' che la differenza con l'i7 950, sarebbe stato interessante inserire nel confronto l'i7 2600k, visto che l'i5 2500k ha un tempo di 61 secondi, con 4 core lisci senza hyper threading, anche se nell'articolo linkato viene citato.

While there are other software/hardware differences in play too, the 32-core 1.80GHz Bulldozer system's 25 seconds compared to the Intel Core i5 2500K (quad-core + Hyper Threading; 3.3GHz + 3.7GHz Intel Turbo Boost) at 61 seconds

Comunque e' buono che si inizi a vedere qualcosa :D .

vize84
23-03-2011, 13:45
Il conteggio dei core nei processori Bulldozer è un po' differente da quanto fino ad adesso in casa AMD. In sostanza i nuovi processori sono composti da moduli e per ogni modulo il sistema operativo vede 2 core, l'Opteron a 16 core pertanto è composto da 8 moduli e in linea di massima dovrebbe essere comparato ai processori Intel con 8 core e HyperThreading attivo (così da raggiungere 16 thread).
Nel test menzionato abbiamo un totale di 32 core visti dal sistema e 16 moduli in totale.
Un singolo test è troppo poco per capire la reale potenza di questi nuovi processori ma dovrebbero avere prestazioni tranquillamente confrontabili coi Sandy Bridge di pari caratteristiche. Aspettiamo nuovi test :)

Tedturb0
23-03-2011, 14:26
Il conteggio dei core nei processori Bulldozer è un po' differente da quanto fino ad adesso in casa AMD. In sostanza i nuovi processori sono composti da moduli e per ogni modulo il sistema operativo vede 2 core, l'Opteron a 16 core pertanto è composto da 8 moduli e in linea di massima dovrebbe essere comparato ai processori Intel con 8 core e HyperThreading attivo (così da raggiungere 16 thread).
Nel test menzionato abbiamo un totale di 32 core visti dal sistema e 16 moduli in totale.
Un singolo test è troppo poco per capire la reale potenza di questi nuovi processori ma dovrebbero avere prestazioni tranquillamente confrontabili coi Sandy Bridge di pari caratteristiche. Aspettiamo nuovi test :)

quindi vuoi dire che questo test equivarrebbe a 2 x 8 core con hypertreading? Se cosi fosse, significherebbe che un opteron 8 core e 1.8ghz fa 50secondi, e un i7 950 a 3ghz 70. Mica male..

zhelgadis
23-03-2011, 15:55
Un 16 core AMD almeno inizialmente va testato contro un 16 core Intel, visto che AMD ti vende - appunto - 16 core, pretendendo che la FPU dimezzata non pesi sulle performance globali.
Se poi un 16 core AMD finirà per costare come un 8core HT Intel, si faranno i test a parità di prezzo, ma questo verrà dopo.
Comunque abbiamo che 32 core AMD, con il 60% della frequenza (1.8 vs 3.06 GHz), vanno circa 2,75 volte più veloci rispetto a 4 core Intel (71 secondi vs 26). Considerato che (faccio ovviamente un conto a spanne) 32/4 * (1.8/3.06) = 4.8... speriamo che i test ufficiali siano un po' più lusinghieri per Bulldozer, che come inizio non c'è proprio niente di cui rallegrarsi.

vize84
23-03-2011, 16:43
Un 16 core AMD almeno inizialmente va testato contro un 16 core Intel, visto che AMD ti vende - appunto - 16 core, pretendendo che la FPU dimezzata non pesi sulle performance globali.
Se poi un 16 core AMD finirà per costare come un 8core HT Intel, si faranno i test a parità di prezzo, ma questo verrà dopo.
Comunque abbiamo che 32 core AMD, con il 60% della frequenza (1.8 vs 3.06 GHz), vanno circa 2,75 volte più veloci rispetto a 4 core Intel (71 secondi vs 26). Considerato che (faccio ovviamente un conto a spanne) 32/4 * (1.8/3.06) = 4.8... speriamo che i test ufficiali siano un po' più lusinghieri per Bulldozer, che come inizio non c'è proprio niente di cui rallegrarsi.

In verità la questione è un po' particolare, nel senso che AMD li chiama core quando in verità non sono dei veri e propri core fisici così come siamo abitutati a pensarli, e danno pertanto prestazioni inferiori a quelle che si avrebbero con core fisici veri e propri, un po' come succede con l'Hyperthreading, sebbene la scelta di AMD sia, almeno sulla carta, preferibile in quanto a prestazioni.
AMD sostiene che un modulo composto da 2 core ha solo un 20% di prestazioni in meno di quello che avrebbero 2 analoghi core fisici.

devil_mcry
23-03-2011, 16:59
In verità la questione è un po' particolare, nel senso che AMD li chiama core quando in verità non sono dei veri e propri core fisici così come siamo abitutati a pensarli, e danno pertanto prestazioni inferiori a quelle che si avrebbero con core fisici veri e propri, un po' come succede con l'Hyperthreading

ma l'ht non prevede una componente hw in più, intesa come unità di calcolo, se guardi un core con ht identifichi solo una unità fisica, l'ht ottimizza le pipeline, in sostanza cerca di sfruttare al massimo l'hw presente

Tedturb0
23-03-2011, 17:02
In verità la questione è un po' particolare, nel senso che AMD li chiama core quando in verità non sono dei veri e propri core fisici così come siamo abitutati a pensarli, e danno pertanto prestazioni inferiori a quelle che si avrebbero con core fisici veri e propri, un po' come succede con l'Hyperthreading, sebbene la scelta di AMD sia, almeno sulla carta, preferibile in quanto a prestazioni.
AMD sostiene che un modulo composto da 2 core ha solo un 20% di prestazioni in meno di quello che avrebbero 2 analoghi core fisici.

se cosi fosse, sarebbero decisamente piu veloci di nehalem. Immagino sullo stesso livello di sandy bridge o giu di li.
Che sarebbe davvero un ottimo risultato per AMD

ps: ormai i confronti si fanno a parita di watt, non core o prezzo :)

Rossi88
23-03-2011, 17:19
se cosi fosse, sarebbero decisamente piu veloci di nehalem. Immagino sullo stesso livello di sandy bridge o giu di li.
Che sarebbe davvero un ottimo risultato per AMD

ps: ormai i confronti si fanno a parita di watt, non core o prezzo :)

Non credo che molti pensino che non conta il prezzo nel confronto :sofico:

giovanni69
23-03-2011, 18:09
be mi ricordo ancora gli opteron veccho stile:D questi 16 core sono esagerati:O

...in effetti me ne servirebbe giusto un '16' per mettere in pensione un Opteron 165 @2.4 Ghz. :D

vize84
23-03-2011, 19:21
ma l'ht non prevede una componente hw in più, intesa come unità di calcolo, se guardi un core con ht identifichi solo una unità fisica, l'ht ottimizza le pipeline, in sostanza cerca di sfruttare al massimo l'hw presente

Si su questo sono d'accordo, l'hyperthreading è diverso dalla tecnica usata da AMD dove effettivamente in un modulo ci sono componenti hw in più rispetto ad un classico core fisico.
Il mio intento era di sottolineare che quelli che AMD chiama core sono un po' diversi da ciò che siamo abitutati a intendere con il termine core e sarebbe fuorviante confrontare un 16 core bulldozer contro un 16 core intel (quando usciranno).
Mi auguro cmq che abbiano grandi prestazioni per mettere un po' di pepe al c... all'intel cosi da anticipare l'uscita di Ivy Bridge :D

Jean240
23-03-2011, 19:46
Si su questo sono d'accordo, l'hyperthreading è diverso dalla tecnica usata da AMD dove effettivamente in un modulo ci sono componenti hw in più rispetto ad un classico core fisico.
Il mio intento era di sottolineare che quelli che AMD chiama core sono un po' diversi da ciò che siamo abitutati a intendere con il termine core e sarebbe fuorviante confrontare un 16 core bulldozer contro un 16 core intel (quando usciranno).
Mi auguro cmq che abbiano grandi prestazioni per mettere un po' di pepe al c... all'intel cosi da anticipare l'uscita di Ivy Bridge :D

assolutamente giustissimo!!

ironman72
23-03-2011, 20:16
Certo che e' molto fuorviante "sbandierare" 16 core quando sono realmente la meta'..:rolleyes: :rolleyes:

blackshard
23-03-2011, 20:38
Certo che e' molto fuorviante "sbandierare" 16 core quando sono realmente la meta'..:rolleyes: :rolleyes:

Il discorso fatto da vize84 è un po' contorto. Tralaltro AMD non ha mai parlato di hyperthreading (?), quindi non vedo cosa c'entri hyperthreading in questo contesto.

Le cose stanno così:

- i "mattoni" fondamentali di bulldozer sono i moduli
- ogni modulo comprende due core *completi* per gli interi ed una FPU *completa* a 256 bit condivisa fra i due core.

Quindi un bulldozer a 16 core significa:

- 16 core interi
- 8 unità FPU

da un solo benchmark su un engineering sample è difficile dire quali saranno le reali prestazioni.

argent88
23-03-2011, 22:56
w la revolucion

Pleg
23-03-2011, 23:00
You lost me.
La crescita di potenza non dovrebbe essere lineare con la frequenza e al quadrato con il voltaggio di alimentazione? :mbe:


Si' per la potenza dinamica e' cosi'.
Si stava riferendo al fatto che per piccole variazioni puoi pensare che la tensione salga linearmente colla frequenza, cioe' per avere un 1% di frequenza in piu' devi aumentare la tensione di alimentazione di circa 1% (perche' ti serve piu' corrente per pilotare la logica piu' in fretta); mettendo insieme la dipendenza lineare con la frequenza e quella quadratica con la tensione, ti viene una dipendenza cubica tra frequenza e potenza (approssimativamente, eh!).

ARARARARARARA
24-03-2011, 00:31
Go! AMD Go!

cosmax
24-03-2011, 07:29
azz!!!!!!non al prodotto ma ai vs commenti
ciao max

scrat1702
24-03-2011, 08:40
Si su questo sono d'accordo, l'hyperthreading è diverso dalla tecnica usata da AMD dove effettivamente in un modulo ci sono componenti hw in più rispetto ad un classico core fisico.
Il mio intento era di sottolineare che quelli che AMD chiama core sono un po' diversi da ciò che siamo abitutati a intendere con il termine core e sarebbe fuorviante confrontare un 16 core bulldozer contro un 16 core intel (quando usciranno).
Mi auguro cmq che abbiano grandi prestazioni per mettere un po' di pepe al c... all'intel cosi da anticipare l'uscita di Ivy Bridge :D

Cosa c'entra Ivy Bridge??? Hanno presentato SB 2 mesi fa e tu vuoi gia le CPU nuove??? :doh: Che poi Ivy Bridge sostituira le attuali SB 1155 percio cmq fascia mainstream e media!
A volte mi sembra che qualcuno qui sia convinto che fare una CPU sia come fare i cioccolatini! Non hanno ancora disponibile il PP a 22nm e gia darteli a gennaio 2012 come hanno annunciato e uno sforzo non indifferente anche per un mostro come intel!!!

shodan
24-03-2011, 09:17
Il discorso fatto da vize84 è un po' contorto. Tralaltro AMD non ha mai parlato di hyperthreading (?), quindi non vedo cosa c'entri hyperthreading in questo contesto.

Le cose stanno così:

- i "mattoni" fondamentali di bulldozer sono i moduli
- ogni modulo comprende due core *completi* per gli interi ed una FPU *completa* a 256 bit condivisa fra i due core.

Quindi un bulldozer a 16 core significa:

- 16 core interi
- 8 unità FPU

da un solo benchmark su un engineering sample è difficile dire quali saranno le reali prestazioni.

Ciao,
l'argomento è effettivamente molto interessante e si apre a più di un'interpretazione.

Da un lato, storicamente ciò che identifica un core è la capacità di eseguire il fetch delle istruzioni (e Bulldozzer implementa una unità di fetch per modulo, condivisa da entrambi i "core" ), dall'altro c'è l'effettiva presenza di due cluster integer.

Quindi, a seconda della definizione che vogliamo dare alla parola "core", possiamo dire che un modulo Bulldozzer è composto da:
- un core (una singola unità di fetch, potenziata e condivisa dai due cluster integer) con doppio cluster integer
- due core (intesi come integer cluster)

Qui c'è una interessante lettura: http://www.realworldtech.com/page.cfm?ArticleID=RWT082610181333&p=1

Riguardo al posizionamento di mercato, dipenderà non solo dal numero dei core, ma dal solito mix di prestazioni/consumo/prezzo.

Vedremo... ;)

fdl88
24-03-2011, 10:33
perchè il confronto non è stato fatto ad esempio con un i7 x990 :stordita:

zhelgadis
24-03-2011, 15:32
Ribadisco che è AMD stessa a darci la sua definizione di "core" ;)
Ogni modulo Bulldozer, per ammissione di AMD conta come due core. Pertanto, quando ci sarà da verificare la bontà della nuova architettura, un 2 moduli - 4 core AMD si testerà contro un 4 core di intel.
Ovviamente una scelta del genere permette ad AMD di pubblicizzare più core disponibili, ma rischia di essere un boomerang qualora un Bulldozer 4 core non riesca a tenere il passo dei 4+4 Intel.
Per quel che mi riguarda, realisticamente mi andrebbe bene un pareggio (facendo una media integer-fp) tra un 4 moduli (8 core) AMD ed un 6+6 Intel, ma ripeto che è AMD ad andarsi a cercare delle rogne, pubblicizzando due core quando in realtà ce n'è uno e mezzo... ;)

zhelgadis
24-03-2011, 15:38
(hargh, mi hanno mangiato le faccine... :-/)

shodan
24-03-2011, 21:43
Ribadisco che è AMD stessa a darci la sua definizione di "core" ;)

Per carità, questo è vero. E' che non tutti sono d'accordo con questa definizione di core, tutto qui... :)

Ogni modulo Bulldozer, per ammissione di AMD conta come due core. Pertanto, quando ci sarà da verificare la bontà della nuova architettura, un 2 moduli - 4 core AMD si testerà contro un 4 core di intel.
Ovviamente una scelta del genere permette ad AMD di pubblicizzare più core disponibili, ma rischia di essere un boomerang qualora un Bulldozer 4 core non riesca a tenere il passo dei 4+4 Intel.
Per quel che mi riguarda, realisticamente mi andrebbe bene un pareggio (facendo una media integer-fp) tra un 4 moduli (8 core) AMD ed un 6+6 Intel, ma ripeto che è AMD ad andarsi a cercare delle rogne, pubblicizzando due core quando in realtà ce n'è uno e mezzo... ;)

In effetti ho, più o meno, anche io aspettative simili: un 4 moduli (otto "core") dovrebbe avere buone possibilità contro un 6 core intel.

Lo scontro sarà sicuramente interessante... ;)
Ciao. :)

zhelgadis
25-03-2011, 14:42
A dirla tutta nemmeno io condivido questa definizione di core :-) ho l'impressione che AMD finirà per darsi la zappa sui piedi da sola, ma tant'è. Evidentemente preferiscono sbandierare 16 core lenti piuttosto che 8 veloci.
Poi, ovviamente dovremo vedere i test: se è vero quel che alcuni dicono, che la FPU è normalmente utlilizzata al 40%, pure una mossa del genere potrebbe aver senso.
Poi, bisognerà pure vedere le prestazioni di questa FPU condivisa - Nehalem quante unità ha, e a quanti bit?
E poi rimane da giocare il jolly, ovvero Fusion: su questo IMHO AMD si gioca molto, considerando che le sue soluzioni sono ben avanti rispetto alle Intel, se veramente riuscisse a portare il traffico FPU su una GPU integrata, la FPU potrebbe diventare un'appendice mantenuta per retrocompatibilità, così come è già oggi per le unità x87 rimpiazzate dalle SSE.

Tra tutto quanto, è un altro il fatto che mi preoccupa - che come dicevo all'inizio del thread, i numeri dell'articolo mi sembrano tutt'altro che rassicuranti... :-/

shodan
25-03-2011, 17:38
A dirla tutta nemmeno io condivido questa definizione di core :-) ho l'impressione che AMD finirà per darsi la zappa sui piedi da sola, ma tant'è.
Evidentemente preferiscono sbandierare 16 core lenti piuttosto che 8 veloci.
In effetti il rischio esiste! :stordita:


Poi, ovviamente dovremo vedere i test: se è vero quel che alcuni dicono, che la FPU è normalmente utlilizzata al 40%, pure una mossa del genere potrebbe aver senso.
Poi, bisognerà pure vedere le prestazioni di questa FPU condivisa - Nehalem quante unità ha, e a quanti bit?

In merito all'utilizzo CPU, dipende tutto dal carico di lavoro: nel lavoro classico "da server" secondo me è anche minore del 40%. Il punto è che Bulldozzer è anche una CPU "home", dove l'FPU, in certi ambiti (giochi, encoding, ecc). è molto più usata. Probabilmente, però, buona parte di questo utilizzo può derivare da cache miss (che fanno stallare l'FPU) e/o basso ILP. Tanto per fare un esempio, tempo ho misurato l'ILP del codice GTK2 (le librerie grafiche di Linux), che sono piuttosto dipendenti da una buona FPU, trovando che era a meno di 2 istruzioni/clock (almeno nell'ambito esaminato). In questo caso, condividere l'FPU potrebbe essere una buona idea ;)


E poi rimane da giocare il jolly, ovvero Fusion: su questo IMHO AMD si gioca molto, considerando che le sue soluzioni sono ben avanti rispetto alle Intel, se veramente riuscisse a portare il traffico FPU su una GPU integrata, la FPU potrebbe diventare un'appendice mantenuta per retrocompatibilità, così come è già oggi per le unità x87 rimpiazzate dalle SSE.


Vero anche questo, però non dimentichiamo che al momento le unità SIMD delle GPU hanno si un throughput molto alto, ma anche una latenza molto elevata: questo significa che in alcune applicazioni (in particolare quelle sequenziali) x87 e SSE/AVX rimarranno piuttosto importanti. Ovviamente a meno che AMD non implementi, nei futuri design, GPU con pipeline dalla latenza più bassa...

Insomma, è una fase davvero molto interessante... vedremo come finirà! :fagiano:

Ciao. :)