45 TDP anche per alcune cpu Phenom

45 TDP anche per alcune cpu Phenom

AMD prevede di avere a disposizione versioni di cpu Phenom con TDP particolarmente ridotti

di pubblicata il , alle 10:27 nel canale Processori
AMD
 
35 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
xeal04 Luglio 2007, 12:39 #11
I c-state in questo caso non c'entrano, e neanche il fatto che una cpu può vedere impiegate solo alcune unità di calcolo per volta (cosa che può accadere anche con una gpu: un gioco può sfruttare maggiormente i pixel oppure i vertex shader, oppure usare più texturing che shading - le dx10 rispondono anche ad esigenze di questo tipo, per sfruttare meglio tutte le unità elaborative). Qui si sta parlando di consumi massimi assoluti, ottenuti per di più (trattandosi del tdp delle cpu amd) solo in condizioni da laboratorio, con temperature sfavorevoli e usando software che hanno l'unico scopo di impegnare al massimo tutte le sezioni della cpu, quindi il confronto con le vga (che vale solo per notare come nelle cpu ad un aumento delle prestazioni non corrisponda un aumento dei consumi per core, cosa desiderabile anche in una vga) va fatto negli stessi termini. Però anche in idle le vga top di gamma dell'ultima generazione consumano un botto, e un sistema di risparmio energetico efficiente quanto un cool'n'quite o uno speedstep non farebbe un brutta figura; però così torniamo al discorso di prima: per fare le cose per bene serve più tempo di quanto ne impieghino per sfornare una nuova famiglia di gpu, specialmente se si tiene conto della complessità circuitale (ma non sarà così per sempre: dopo i sistemi Santa Rosa mi aspetto che arrivino presto anche le gpu Locatelli che fanno le cose per bene ).
xeal04 Luglio 2007, 12:59 #12
No, ancora 512k di L2 + 128k di L1: le cache degli amd sono esclusive, quindi contengono dati diversi (anche se non si può semplicemente effettuare una somma e concludere che abbiano 640k di cache complessivamente, perchè la l2 può contenere qualsiasi cosa, mentre la l1 è divisa in due: 64k di dati e 64k di istruzioni). Considera anche che una cache più grande e unificata ha mediamente latenze maggiori, e che il controller integrato rende meno sentita l'esigenza di cache maggiori (meno vero in un quadcore, anche se penso che la l3 unificata sarà inclusiva e suppongo che servirà principalmente a velocizzare l'ispezione delle cache "private", oltre che a mascherare le latenze verso la memoria, ma potrei sbagliare). Quando nelle architetture amd si sentirà l'esigenza di cache veramente imponenti, allora arriveranno, e arriverà anche la zram, con un numero di transistor sensibilmente minore e latenze di accesso, a seconda delle dimensioni, anche migliori rispetto alle sram (penso che si continuerà con piccole L2 private, in sram, e grosse l3 condivise, in zram).
george_p04 Luglio 2007, 16:34 #13
Se non sbaglio la zram viene prodotta da un azienda di recente acquisizione da parte di AMD, letto mi pare sempre su queste pagine.

Son proprio curioso di vedere le prestazioni dei phenom, soprattutto rispetto al mio Sempron 3000+ che sto per sostituire con un athlon BE-2350.

Potrei chiedere se qualcuno conosce, in percentuale, l'aumento di prestazioni dovuto alla scalabilità dei sistemi multiprocessori opteron o serie FX in genere?

Quanto aumenta ad es, in un sistema a doppio processore e quanto in uno a 3 o a 4 ad es.

Questo anche per capire se il prezzo per ogni Opteron delle serie 8 valga veramente la pena rispetto a quelli della serie 2.

In definitiva, converrebbe una potenza di calcolo di 4 workstation dual processor serie 2 o FX o una workstation con 8 processori opteron? E soprattutto cosa costerebbe di più?

Premetto che lavoro nella grafica 3D e una potenza di calcolo maggiore aiuterebbe a diminuire i tempi di rendering.
xeal04 Luglio 2007, 18:03 #14
In generale dipende molto dalle applicazioni, da quanto sono parallelizzate e da come (in generale, bisognerebbe vedere se il codice che preso in esame prevede una notevole interazione tra i processori durante le elaborazioni, oppure se ognuno esegue molti calcoli prima di dover sincronizzare il lavoro con gli altri, ma conta anche come sono distribuiti i dati tra i processori, se i vari thread elaborano dati "propri" oppure se le elaborazioni riguardano gli stessi dati; però con queste considerazioni forse si va un po' troppo per il sottile).

Per il confronto in base ai core: supponendo che l'applicazione, ed è il tuo caso, sfrutti bene molti core/processori, si può fare una schematizzazione di questo tipo:

- nei sistemi intel, in generale, all'aumentare del numero di processori/core diminuisce la banda disponibile per ciascuno, perchè tutte le comunicazioni tra le cpu e gli accessi alla memoria impegnano il chipset (tant'è che si usano chipset particolari, con delle cache di alcune decine di MB per ovviare), quindi si ha un decadimento prestazionale più o meno marcato rispetto alla potenza di calcolo massima teorica (la somma delle capacitò di calcolo dei singoli processori: l'uso condiviso dello stesso memory controller tende a fare da collo di bottiglia); nei quad core attuali, ottenuti affiancando due dual core in un package, la situazione è equivalente a quella in cui si hanno più dual core, quindi l'unico vantaggio consiste nel poter realizzare sistemi con più core fisici sulla stessa scheda madre; nei futuri quad core nativi la situazione migliorerà un po' (non che ora sia particolarmente tragica, eh, solo c'è un qualche collo di bottiglia di cui è meglio essere a conoscenza per fare delle scelte oculate), grazie alle comunicazioni tra i core di una stessa cpu che diventeranno interne e sgraveranno un po' il chipset; la vera svolta, da questo punto di vista, arriverà con i Nehalem,

- nei sistemi amd, grazie al controller integrato e all'architettura NUMA, all'aumentare delle cpu (= pezzo di silicio infilato nel socket, a prescindere dal numero di core), aumenta anche la banda complessiva del sistema verso la memoria, e in più i processori comunicano attraverso HyperTransport, quindi gli accessi in memoria non ne risentono; poichè però i core di una stessa cpu condividono il memory controller, all'aumentare del numero dei core si ha un leggero decadimento prestazionale (tendenzialmente inferiore, comunque, a quello che si ha con gli intel), compensato anche in questo caso dai vantaggi dell'avere un singolo sistema con tante cpu (il problema, comunque, è relativo, perchè i quad core opteron k10 devono ancora arrivare e saranno sicuramente più veloci di due dual core k8, mentre i dual core k10 - se previsti, questo non lo ricordo - arriveranno ancora dopo; a meno che tu non stia valutando anche l'opzione di un sistema multivia basato su singlecore);

- i vantaggi di un sistema unico con molti processori, rispetto a un cluster di più sistemi, a parità di numero complessivo di core fisici, consiste nella maggiore velocità nelle comunicazioni tra i processori e nell'accesso ai dati in memoria (che sarebbero inevitabilmente distribuiti tra i sistemi del cluster), poichè nel cluster avvengono in maniera esterna al singolo sistema, quindi attraverso la connessione realizzata (tipicamente di tipo ethernet, quindi al più delle gigabit, a meno di realizzare un supercomputer e optare per connessioni studiate ad hoc e in fibra). Ancora, l'incidenza della velocità nelle connessioni dipende molto dal tipo di algoritmo e dall'implementazione specifica, ma nel caso del rendering in generale si ha a che fare con algoritmi ricorsivi e influenza reciproca dei risultati parziali (ad esempio, nella radiosity ogni superficie diffonde la luce verso le altre, che a loro volta ne rispediranno una parte verso quella/e da cui l'hanno ricevuta, influenzando e variando ad ogni passo l'illuminazione della scena, nel complesso e nelle singole parti). Piccola nota: è possibile, in via teorica (non so se qualcuno lo faccia - a parte alcune schede per 8 opteron, che usano una scheda base e delle schede figlie che comunicano appunto via htt, per non realizzare un pcb enorme), realizzare comunicazioni esterne basate sul bus hypertransport, però diventano soluzioni custom, quindi complicate e costose.

Per quanto riguarda i costi, anche qui tutto è relativo: il singolo processore della serie 2 costa meno rispetto a uno della serie 8, però non sono sicuro che due workstation con due dual core posssano costare meno di un singolo sistema con quattro dual core. A mio modestissimo avviso, facendo un'analisi esclusivamente qualitativa (non ho listini sotto mano ), a seconda delle esigenze specifiche, è meglio, per quanto possibile, rimanere nell'ambito di un singolo sistema con più processori e core per processore, quindi, se non si hanno esigenze particolari, mi sembrano equilibrati o un sistema dual dualcore, oppure uno con 4 dualcore (ma anche quad core; passare poi a sistemi a otto vie diventa più complicato). A meno che non si abbiano a disposizione dei "vecchi sistemi" da riciclare, o delle workstation equivalenti a quella che si vuole sostituire (se è una sola) reperibili a basso costo (ad esempio usate, dismesse da grosse ditte) e allora si può fare un serio pensierino a un cluster, software permettendo (però bisognerebbe anche valutare la questione dei consumi di un sistema più complesso e basato su tecnologie meno recenti). Gli fx a due vie sono pressoché identici agli opteron, ma sono di nicchia e costicchiano, non so quanto si possa risparmiare rispetto agli opteron, considerando che da un lato la memoria che usano è unbuffered e quindi costa meno, ma dall'altro la maggiore sicurezza data dalla ecc può avere un suo peso nella decisione finale. Alla fine, credo che convenga sempre valutare soluzioni alternative più o meno equivalenti e fissare un tetto di spesa con un minimo di flessibilità.

Spero di esserti stato di aiuto
xeal04 Luglio 2007, 18:10 #15
P.S. la zram è stata brevettata da una società dalla quale amd ha acquistato delle licenze per sfruttarla nei propri processori. Fondamentalmente si tratta di una ram dinamica che sfrutta le capacità parassite dei wafer SOI per immagazzinare un bit con un solo transistor, quindi è fino a 6 volte più densa della ram statica; inoltre implementa un particolare sistema di lettura che non dipende dai cicli del condensatore, tipici della dram, e quindi ha latenze in lettura confrontabili con quelle di una sram (se non migliori). Per quanto riguarda la scrittura, invece, si deve rispettare il clock, che al momento arriva al massimo a 400 mhz; però la maggiore densità fa sì che, per blocchi di memoria notevoli (decine o centinaia di MB), la lunghezza notevolmente minore delle piste (e i minori problemi connessi) renda la latenza complessiva molto competitiva, se non migliore, rispetto alla sram.
george_p04 Luglio 2007, 19:13 #16

Grazie!!

Grazie xeal,
sei stato veramente troppo gentile e disponibile oltre che molto esauriente!

Come ultima cosa, se non chiedo troppo, la velocità di connessione tra i processori all'interno di una scheda madre (avviene esclusivamente via Hypertrasport o per le cpu in altro modo!?) quanto sarebbe maggiore (in linea approssimativa) rispetto a quella/e utilizzata/e per collegare più sistemi (cioè via ethernet, fibra)?

Ti ringrazio tantissimo anticipatamente e chiudo l'OT.

Ciao
MiKeLezZ04 Luglio 2007, 20:54 #17
AMD = FUTURO

nel senso che parla sempre al futuro... "usciranno" "saranno" "avranno"... sono 2 anni che sentiamo baggianate su cose non ancora esistenti
addirittura ora si è messa anche a divulgare benchmark sulle "presunte potenzialità" e a parlare di versioni di processore il cui originario non si è ancora visto neppure in azione



p.s. la z-ram funziona con il SOI e AMD il SOI lo può usare solo per i 90nm e 65, per i 45nm userà i dielettrici ad alto k, similmente a Intel... fate quindi i vostri conti
MiKeLezZ04 Luglio 2007, 20:57 #18
Originariamente inviato da: Dreadnought
In tutto questo va sempre considerato che nelle cpu AMD c'è il controller della memoria + il crossbar switch che non è che consumino proprio zero, anzi i loro 5-10W (la metà di un northbridge intel tanto per dire) li consumano.
Tanti bei discorsi, quando però si va a confrontare MB AMD + CPU AMD da 65W contro MB Intel + CPU Intel da 65W tutte le teorie le vediamo cadere... Il controller di memoria integrato, il TDP di Intel farlocco, bla bla bla...
C'è solo il grafico del sistema Intel che dimostra come il tale consumi meno.
Strano.
OverdeatH8604 Luglio 2007, 21:00 #19
la battaglia penryn barcelona si fa sempre piu avvincente!!
JohnPetrucci04 Luglio 2007, 21:42 #20
Originariamente inviato da: OverdeatH86
la battaglia penryn barcelona si fa sempre piu avvincente!!

Sperando che arrivi un giorno questa battaglia e che non ci si dilunghi con proclami e chiacchiere.
In ogni caso se battaglia ci sarà, speriamo non sia un'altra batosta per AMD.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^