Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Questo mouse ultraleggero, con soli 36 grammi di peso, è stato concepito per offrire un'esperienza di gioco di alto livello ai professionisti degli FPS, grazie al polling rate a 8.000 Hz e a un sensore ottico da 33.000 DPI. La recensione esplora ogni dettaglio di questo dispositivo di gioco, dalla sua agilità estrema alle specifiche tecniche che lo pongono un passo avanti
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Dal richiamo di Enrico Letta alla necessità di completare il mercato unico entro il 2028 alla visione di Nokia sul ruolo dell’IA e delle reti intelligenti, il Nokia Innovation Day 2025 ha intrecciato geopolitica e tecnologia, mostrando a Vimercate come la ricerca italiana contribuisca alle sfide globali delle telecomunicazioni
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
OPPO Reno14 F 5G si propone come smartphone di fascia media con caratteristiche equilibrate. Il device monta processore Qualcomm Snapdragon 6 Gen 1, display AMOLED da 6,57 pollici a 120Hz, tripla fotocamera posteriore con sensore principale da 50MP e generosa batteria da 6000mAh con ricarica rapida a 45W. Si posiziona come alternativa accessibile nella gamma Reno14, proponendo un design curato e tutto quello che serve per un uso senza troppe preoccupazioni.
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 24-11-2010, 08:42   #5521
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
La banda RAM non basta mai. Esisteranno sempre applicazioni per cui il quadchannel da qualche vantaggio. Per esempio applicazioni di calcolo matriciale, dove i calcoli sono delle banali addizioni e moltiplicazioni... Li se usi tutti e 8 core (come fa Matlab) si è RAM bound...
Chiaro che la banda non basti mai, ma non era quello il motivo. Ne facevo più una questione di costi. E' chiaro che un quad channel su un computer da 350-500€ valga una buona percentuale di costi. Senza contare l'obbligo di inserire 4 slot sulle schede madri, invece di due.
Inoltre è un problema anche per le schede madri di alto livello, visto che obbliga ad inserire 8 slot, altrimenti qualsiasi upgrade di memoria sarebbe precluso.
E' chiaro invece che su una workstation influisca meno sul costo finale, visto che una workstation parte da costi decisamente alti.
Paradossalmente influisce di più su un server 1P che su una workstation, visto che le memorie ECC costano molto di più di quelle normali.
Chiaro che se si va oltre il costo aggiuntivo non influisce in percentuale rilevante sul costo finale.
cionci è offline  
Old 24-11-2010, 09:03   #5522
greeneye
Senior Member
 
L'Avatar di greeneye
 
Iscritto dal: Dec 2000
Città: Parma
Messaggi: 3121
http://www.semiaccurate.com/2010/11/...-breakthrough/
greeneye è offline  
Old 24-11-2010, 09:10   #5523
checo
Senior Member
 
L'Avatar di checo
 
Iscritto dal: Aug 2000
Messaggi: 17963
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Condivido.
Probabilmente (ma lo immagino, la mia competenza non arriva a tanto), l'utilizzo in ambiente server, con più programmi che sfruttano più core e con più programmi che "girano" contemporaneamente... il tutto è molto più estremizzato... e quindi di qui il potenziamento. Però rimane il fatto che un BD X8 nasce come dual channel sia in ambito server che desktop... e se gli basta per server, a maggior ragione per desktop sarebbe... sovradimensionato... sempre relativamente.
dipende sempre da cosa "ci gira" la necessità di banda è ben diversa a seconda delle operazioni che la cpu deve fare.
__________________
.
checo è offline  
Old 24-11-2010, 09:13   #5524
greeneye
Senior Member
 
L'Avatar di greeneye
 
Iscritto dal: Dec 2000
Città: Parma
Messaggi: 3121
Quote:
The first outward signs of problems were in the Q2 AMD conference call last July. If you recall, Dirk Meyer punted on when Llano would be out, and most people took that as a really bad sign. It was, but only for a very short period of time. The reason for it was simple, at that point in time, AMD really didn't know for sure what was going on.

...

Sources tell us, and AMD denies, that the first batch of chips out of the fab had a yield of precisely zero.

Quote:
Luckily, things got much better very quickly. Sources tell SemiAccurate that the next batch of chips came back days after the CC, and yield was infinitely better. By infinitely, we mean that in the mathematical sense, not that yields were production ready, they were not, but progress was steady.
Quote:
Checking in with some people wandering the halls of a certain town north of Bannewitz showed that progress was moving forward, and things were tracking well for the Q2 release. Some tool monkeys said that things may be pulled in a few weeks, but still Q2. Optimism was the key word.
Quote:
As things stand today, there are a lot of people dancing in bunny suits, then going to the local beer hall and getting blitzed. Bad pun. It would not surprise me at all to hear that Llano was pulled in a great deal soon, and late Q2 becomes early Q2, maybe even sooner.
c
greeneye è offline  
Old 24-11-2010, 09:58   #5525
Fabiano 82
Senior Member
 
L'Avatar di Fabiano 82
 
Iscritto dal: Apr 2009
Città: Roma
Messaggi: 934
da HardwareUpgrade
...Troveremo frequenze di clock che potrebbero raggiungere e superare i 3,5 GHz di massimo, ottenute grazie alla tecnologia produttiva a 32 nanometri high-k metalgate con tensione di alimentazione variabile da 0,8V a 1,3V di massimo. Per ogni modulo Bulldozer, all'interno del quale è presente una coppia di unità di calcolo integer, la superficie complessiva sarà pari a 30,9 millimetri quadrati comprensiva della cache L2 da 2 Mbytes.

La cache di terzo livello da 8 Mbytes sarà composta da 4 moduli da 2 Mbytes ciascuno, completamente indipendenti tra di loro, con una frequenza di clock superiore a 2,4 GHz con tensione di alimentazione di 1.1V. La cache L3 integrerà varie ottimizzazioni legate a migliorare l'efficienza complessiva oltre a diminuire il consumo complessivo...

http://www.hwupgrade.it/news/cpu/nuo...zer_34531.html
__________________
Motherboard: MSI X570 A-Pro CPU: Ryzen 5700X Dissi: DEEPCOOL GAMMAX L240 V2 Ram: 32 GB Kingstone Fury Renegade 3600Mhz
VGA: ASROCK 6700XT HDD: Sabrent NVME4 1TB + Samsung 980 NVME 1TB Ali: Corsair TX 650W Monitor: Samsung 27"TF35 Case: MSI MAG VAMPIRIC 300R
Fabiano 82 è offline  
Old 24-11-2010, 10:14   #5526
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24169
Quote:
Originariamente inviato da Fabiano 82 Guarda i messaggi
da HardwareUpgrade
...Troveremo frequenze di clock che potrebbero raggiungere e superare i 3,5 GHz di massimo, ottenute grazie alla tecnologia produttiva a 32 nanometri high-k metalgate con tensione di alimentazione variabile da 0,8V a 1,3V di massimo. Per ogni modulo Bulldozer, all'interno del quale è presente una coppia di unità di calcolo integer, la superficie complessiva sarà pari a 30,9 millimetri quadrati comprensiva della cache L2 da 2 Mbytes.

La cache di terzo livello da 8 Mbytes sarà composta da 4 moduli da 2 Mbytes ciascuno, completamente indipendenti tra di loro, con una frequenza di clock superiore a 2,4 GHz con tensione di alimentazione di 1.1V. La cache L3 integrerà varie ottimizzazioni legate a migliorare l'efficienza complessiva oltre a diminuire il consumo complessivo...

http://www.hwupgrade.it/news/cpu/nuo...zer_34531.html
Clicca qui...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 24-11-2010, 10:23   #5527
Fabiano 82
Senior Member
 
L'Avatar di Fabiano 82
 
Iscritto dal: Apr 2009
Città: Roma
Messaggi: 934
scusate, sono arrivato un pò tardi...
__________________
Motherboard: MSI X570 A-Pro CPU: Ryzen 5700X Dissi: DEEPCOOL GAMMAX L240 V2 Ram: 32 GB Kingstone Fury Renegade 3600Mhz
VGA: ASROCK 6700XT HDD: Sabrent NVME4 1TB + Samsung 980 NVME 1TB Ali: Corsair TX 650W Monitor: Samsung 27"TF35 Case: MSI MAG VAMPIRIC 300R
Fabiano 82 è offline  
Old 24-11-2010, 10:28   #5528
Capozz
Senior Member
 
L'Avatar di Capozz
 
Iscritto dal: Aug 2007
Messaggi: 10227
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
La banda RAM non basta mai. Esisteranno sempre applicazioni per cui il quadchannel da qualche vantaggio. Per esempio applicazioni di calcolo matriciale, dove i calcoli sono delle banali addizioni e moltiplicazioni... Li se usi tutti e 8 core (come fa Matlab) si è RAM bound...
In ambito desktop è perfettamente inutile anche il triple channel, figuriamoci il quad...
Ovviamente la musica cambia se parliamo di server e workstation, ma suppongo che per gli opteron abbiano trovato soluzioni adeguate.
__________________
CM Carbide Air 540 - Thermaltake Toughpower GF A3 1200W - Asus Prime Z690-P D4 - Intel Core i7 14700K - Arctic Liquid Freezer III 280 A-RGB - 32GB Corsair Vengeance LPX 3200 - Gigabyre RTX 5070 Ti SFF - SSD Crucial T500 2TB - AOC Gaming CU34G2X
CM Q500L - OCZ ZT-650W - Asus TUF Gaming A520M Plus - AMD Ryzen 5500 - 32GB Corsair Vengeance LPX 3200 - RTX 2070 Super ROG Strix - SSD Samsung 970 EVO Plus 1TB - ASUS TUF Gaming VG27AQ1A 27"
Capozz è offline  
Old 24-11-2010, 11:20   #5529
idkfa
Member
 
Iscritto dal: Jun 2009
Messaggi: 239
Quote:
Originariamente inviato da Capozz Guarda i messaggi
In ambito desktop è perfettamente inutile anche il triple channel, figuriamoci il quad...
Ovviamente la musica cambia se parliamo di server e workstation, ma suppongo che per gli opteron abbiano trovato soluzioni adeguate.


Se non ricordo male i tri sovrasta il dual per un enorme 3% in più di prestazioni.


Quindi con questa gran differenza conviene prendere il triple channel
idkfa è offline  
Old 24-11-2010, 11:24   #5530
dany700
Senior Member
 
Iscritto dal: Dec 2005
Messaggi: 1113
una curiosità...

mentre BD è sviluppato mantenendo un certo equilibrio in ampiezza tra cache L2 e L3...SB avrà una strutturazione fuori dalle righe: L3 ampia sarà pure necessaria per velocizzare le operazioni sui dati in attesa...ma le operazioni "raffinate" si eseguono in L2. La L2 in SB è 1/4 rispetto a quella di BD a livello di singolo core...senza contare l'ulteriore elasticità che un modulo BD vanta nel complesso con i 2 interi.

Non vorrei dire castronerie...ma credo che la logica computazionale di BD sarà notevolmente superiore in termini di calcolo puro a valle delle operazioni...ma non tanto per la capacità elaborativa...ma per il fluire dei risultati finali in una certa unità di tempo, in particolare se di una certa complessità.

Migliorare l'ampiezza della L3 ha un senso...ma ne avrebbe maggiormente se fosse bilanciata da una corretta L2...o sbaglio?
__________________
X79A-GD45 , 3820K , 32Gb G.SKILL 2400, Sapphire 5850 , Antec 650W, HP 27ES
dany700 è offline  
Old 24-11-2010, 11:56   #5531
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da idkfa Guarda i messaggi


Se non ricordo male i tri sovrasta il dual per un enorme 3% in più di prestazioni.

Quindi con questa gran differenza conviene prendere il triple channel
Dipende cosa intendi, se per bench di banda o per differenza IPC del procio.

Ti faccio un esempio:
Se io setto le DDR3 su un Thuban double-channel a 800MHz e faccio i test di banda, ottengo un risultato chiaramente più basso (e non di poco) che applicando 2GHz per le stesse memorie. Lo stesso credo che si abbia tra fare un Bench di banda tra un double-channel e three-channel su un i7.

Il problema è che quando invece faccio un bench sulle prestazioni del procio, IPC, le cose non cambiano nella stessa misura.

Poi, ad esempio, non si può fare questa distinzione come linea di massima. Ad occhio, ad esempio, un double-channel con DDR3 a 2GHz penso equivalga ad un three-channel con DDR3 a 1333MHz, il che soddisferebbe la "voracità" del procio con entrambe le soluzioni. Però, fare un three-channel con DDR3 2GHz avresti si più banda, ma se al procio la condizione precedente già soddisferebbe, avere lo 0,01% in più cosa direbbe?

Insomma, non è che sto dicendo che avere una banda superiore faccia certamente male (Bjt2 e Cionci non hanno certamente torto), ma bisogna vedere nelle applicazioni reali cosa si guadagna effettivamente, cioè se per quello che spendi di più hai un ritorno in prestazioni.
Infatti, se noti, i più acquistano gli i7 8XX al posto degli i9XX perché appunto la differenza di prezzo non vale assolutamente la candela, e chi acquista gli i9XX, il più delle volte, se non per differenze esigue di costo, va più sul double-channel che sul three-channel.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593

Ultima modifica di paolo.oliva2 : 24-11-2010 alle 12:08.
paolo.oliva2 è offline  
Old 24-11-2010, 12:05   #5532
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da dany700 Guarda i messaggi
una curiosità...

mentre BD è sviluppato mantenendo un certo equilibrio in ampiezza tra cache L2 e L3...SB avrà una strutturazione fuori dalle righe: L3 ampia sarà pure necessaria per velocizzare le operazioni sui dati in attesa...ma le operazioni "raffinate" si eseguono in L2. La L2 in SB è 1/4 rispetto a quella di BD a livello di singolo core...senza contare l'ulteriore elasticità che un modulo BD vanta nel complesso con i 2 interi.

Non vorrei dire castronerie...ma credo che la logica computazionale di BD sarà notevolmente superiore in termini di calcolo puro a valle delle operazioni...ma non tanto per la capacità elaborativa...ma per il fluire dei risultati finali in una certa unità di tempo, in particolare se di una certa complessità.

Migliorare l'ampiezza della L3 ha un senso...ma ne avrebbe maggiormente se fosse bilanciata da una corretta L2...o sbaglio?
Non sono certo super-competente, ma probabilmente l'architettura della L2-L3 di SB e di BD è in dipendenza dell'architettura dei proci e come bilanciamento di pregi-difetti degli stessi.

Mi sembra di ricordare che gli i7 nella L1 e L2 sono comunque più veloci (e mi sembra non di poco) rispetto al Phenom II. Quindi una L1 e L2 "ridotte" rispetto al Phenom II probabilmente lo è perché più grosse... non servirebbero o comunque alzerebbero il costo del procio senza una controparte di guadagno adeguata.

Comunque ricordo che un "tecnico" AMD aveva riportato che nel Phenom II avere una L2 da 1MB a core senza L3, si ottenevano circa le stesse prestazioni del sistema L2 a 512KB + L3.
BD secondo me è una via di mezzo perché ha una L2 "grossa" perché comunque è condivisa tra 2 core... (e comunque rappresenterebbe una L2 da ben 2MB per 1 core nel caso di 1 TH in esecuzione, e ciò certamente vorrà dire), conservando comunque una L3 di 8MB che comunque non sarebbe "striminzita".
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 24-11-2010, 12:24   #5533
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Volevo portare ad una riflessione su un punto, che per me è importante per comprendere il TDP/clock del 32nm HKMG AMD.

Porto questo paragone:
il 45nm SOI low-k ha queste caratteristiche, almeno per un 1090T:
1,30-1,35V (circa), per contenere il TDP dentro i 125W come X6.
1,475V, in Turbo-mode, per contenere la differenza dentro i 125W sempre, con 3 core che "lavorano" a +400MHz sopra la frequenza def.

Però, occhio, il Thuban non è selettivo con il Vcore, quindi ci troveremmo tutti e 6 i core che lavorano a 1,475V, di cui solo 3 a +400MHz, ma SEMPRE rimanendo dentro i 125W TDP.

Quello che voglio dire, è che anche considerando che il Turbo non applichi i +400MHz per 3 core, un procio dato a 125W TDP a 1,35V resterebbe sempre dentro i 125W TDP pur con un Vcore 1,475V, cioè di ben 0,125V più alto.

Con le classiche formule matematiche (che non ricordo ), se le applicassimo, il TDP certamente schizzerebbe e non di poco.

Premetto... io faccio questa riflessione ad intuito e poi, chi competente, valuterà o meno.

Se trasportiamo questa ottica riferendo il tutto come prerogativa caratteristica silicio SOI, a maggior ragione il 32nm SOI HKMG, avendo un range di tensione inferiore, l'aumento di TDP in base al Vcore dovrebbe essere ancora inferiore, con un guadagno più marcato in frequenza.

Il 32nm SOI avendo un range da 0,8V a 1,3V di massimo, che poi 1,3V certamente non sarà quello massimo applicabile prima che tutto fonda (il 45nm E0 avrebbe un massimo di 1,55V, oltre si può andare ma raffreddandolo a dovere), dovrebbe avere un aumento di frequenza maggiore del 45nm a parità di aumento di tensione.
Come dire... il 45nm con +0,05V aumenta di 200MHz? Il 32nm HKMG con lo stesso aumento di Vcore potrebbe dare +400MHz.
Di qui, se nella selezione AMD applicherebbe 95W ad esempio ad un X8 che "lavorerebbe" a 1,1V (esempio), magari il procio con un silicio "migliore", potrebbe ad esempio, sempre a 1,1V, essere 4GHz. Un po' come un 1055T a 1,3V è 125W TDP a 2,8GHz, ed un 1090T, sempre a 1,3V 3,2GHz allo stesso TDP.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593

Ultima modifica di paolo.oliva2 : 24-11-2010 alle 12:29.
paolo.oliva2 è offline  
Old 24-11-2010, 12:33   #5534
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Esatto, però forse ti sfugge questo:
gli MCM AMD per server hanno 12/16 core e sono formati rispettivamente da 2 BD X6 o X8, con ognuno un dual channel, ed il quad channel è la somma dei 2 MC dei 2 proci.
Ma questo di per sè cosa evidenzia? Che un BD X8 ha sempre un dual Channel e che gli "basta" nel suo impiego sia server che desktop, e non ci sarebbe alcuna differenza di performances a livello di die singolo.
Tra le versioni EX e gli stessi proci versione desktop, invece a me sembra che cambi radicalmente la cosa, aggiungendo anche L3 più piccole. Forse è stato fatto per ridurre i costi, probabilmente, ma sicuramente diminueranno pure le prestazioni... perché se non vi fosse alcuna differenza, non avrebbe senso... la differenza.
Non mi sfugge niente semmai il contrario.

Avere due chip nello stesso package presuppone che il singolo die sia dotato di più linee HT per il collegamento(+transistor), che per forza di cose sarà inferiore ad uno interno.

L'approccio di Amd è ottimo perchè riduce i design necessari, ottimizzando i costi anche in fatto di rese(die più piccolo).


La cache di solito si fa sentire di più in ambito server/workstation che in quello desktop, quindi mi sembra sensato aumentare la dotazione ed i costi solo dove se ne trae maggior beneficio.

Ultima modifica di Ren : 24-11-2010 alle 12:37.
Ren è offline  
Old 24-11-2010, 12:59   #5535
dany700
Senior Member
 
Iscritto dal: Dec 2005
Messaggi: 1113
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Non sono certo super-competente, ma probabilmente l'architettura della L2-L3 di SB e di BD è in dipendenza dell'architettura dei proci e come bilanciamento di pregi-difetti degli stessi.

Mi sembra di ricordare che gli i7 nella L1 e L2 sono comunque più veloci (e mi sembra non di poco) rispetto al Phenom II. Quindi una L1 e L2 "ridotte" rispetto al Phenom II probabilmente lo è perché più grosse... non servirebbero o comunque alzerebbero il costo del procio senza una controparte di guadagno adeguata.

Comunque ricordo che un "tecnico" AMD aveva riportato che nel Phenom II avere una L2 da 1MB a core senza L3, si ottenevano circa le stesse prestazioni del sistema L2 a 512KB + L3.
BD secondo me è una via di mezzo perché ha una L2 "grossa" perché comunque è condivisa tra 2 core... (e comunque rappresenterebbe una L2 da ben 2MB per 1 core nel caso di 1 TH in esecuzione, e ciò certamente vorrà dire), conservando comunque una L3 di 8MB che comunque non sarebbe "striminzita".
appunto

quando i capoccia AMD hanno dichiarato un enorme crescita a livello del MC...non credo si riferissero semplicemente ad un throughput del 50%.

Non conosciamo le latenze...ma per quanto siano buone quelle di SB...non riusciranno mai a competere con la L2 di BD ben 4 volte più ampia. (pur ipotizzando che in BD vi sia una scarsa latenza).

l'architettura di SB così come la conosciamo ora salvo bench accurati...
IMHO...mi pare organizzata per immaganizzare una certa quantità di dati agglomerati "semplici" in L3...a causa della limitata L2. Questo non significa che si avranno colli di bottiglia a valle...ma sicuramente rappresentano un enorme inefficienza a livello temporale...a causa delle continue chiamate tra L2 e L3 in MT ma soprattutto in ST, rispetto a BD.

Per carità...io sono un niubbo...per cui, ciò che mi pare evidente, potrebbe non esserlo
__________________
X79A-GD45 , 3820K , 32Gb G.SKILL 2400, Sapphire 5850 , Antec 650W, HP 27ES
dany700 è offline  
Old 24-11-2010, 13:03   #5536
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da dany700 Guarda i messaggi
una curiosità...

mentre BD è sviluppato mantenendo un certo equilibrio in ampiezza tra cache L2 e L3...SB avrà una strutturazione fuori dalle righe: L3 ampia sarà pure necessaria per velocizzare le operazioni sui dati in attesa...ma le operazioni "raffinate" si eseguono in L2. La L2 in SB è 1/4 rispetto a quella di BD a livello di singolo core...senza contare l'ulteriore elasticità che un modulo BD vanta nel complesso con i 2 interi.

Non vorrei dire castronerie...ma credo che la logica computazionale di BD sarà notevolmente superiore in termini di calcolo puro a valle delle operazioni...ma non tanto per la capacità elaborativa...ma per il fluire dei risultati finali in una certa unità di tempo, in particolare se di una certa complessità.

Migliorare l'ampiezza della L3 ha un senso...ma ne avrebbe maggiormente se fosse bilanciata da una corretta L2...o sbaglio?
Ciao
Bd è molto throughput oriented come hai ben potuto notare.
Le dimensioni della L3 di sb sono aumentate per coprire la piccola dimensione della L2. Quello che realmente conta comunque oltre alla dimensioni, è la load to use latency, ovvero trovato ciò che mi serve quanto impiego per portarlo alle execution unit, e nel caso di un accesso alla L2 in sb si parla di circa 10 cicli, molto ben mascherabili dall'hardware. Mascherabili nel senso che in quei 10 cicli hai qualcos'altro da fare nel frattempo che ti arrivi l'operando contenuto nella L2.


Quote:
Originariamente inviato da Ren Guarda i messaggi
Cut

La cache di solito si fa sentire di più in ambito server/workstation cut
.
Ciao
Mi permetto di dire una cosa, in ambiente server, sopratutto se multithreaded (come il 98% delle applicazioni server) la dimensione ha un impatto minore rispetto ad un ambiente dekstop, in quanto essendoci al max 2 thread che devono compiere una marea di cose (caso giochino thread rendering + thread misto I\O fisica ai audio e corbellerie varie) tendono a tassare di più una L2 di tipo privato per core (come quella dei k10 e dei nehalem)
Ad esempio vedi le ottime prestazioni che hanno tuttora i c2q nei giochini non fortemente multithreaded, questo grazie alla loro enorme L2 condivisa
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 24-11-2010, 13:16   #5537
dany700
Senior Member
 
Iscritto dal: Dec 2005
Messaggi: 1113
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Volevo portare ad una riflessione su un punto, che per me è importante per comprendere il TDP/clock del 32nm HKMG AMD.

Porto questo paragone:
il 45nm SOI low-k ha queste caratteristiche, almeno per un 1090T:
1,30-1,35V (circa), per contenere il TDP dentro i 125W come X6.
1,475V, in Turbo-mode, per contenere la differenza dentro i 125W sempre, con 3 core che "lavorano" a +400MHz sopra la frequenza def.

Però, occhio, il Thuban non è selettivo con il Vcore, quindi ci troveremmo tutti e 6 i core che lavorano a 1,475V, di cui solo 3 a +400MHz, ma SEMPRE rimanendo dentro i 125W TDP.

Quello che voglio dire, è che anche considerando che il Turbo non applichi i +400MHz per 3 core, un procio dato a 125W TDP a 1,35V resterebbe sempre dentro i 125W TDP pur con un Vcore 1,475V, cioè di ben 0,125V più alto.

Con le classiche formule matematiche (che non ricordo ), se le applicassimo, il TDP certamente schizzerebbe e non di poco.

Premetto... io faccio questa riflessione ad intuito e poi, chi competente, valuterà o meno.

Se trasportiamo questa ottica riferendo il tutto come prerogativa caratteristica silicio SOI, a maggior ragione il 32nm SOI HKMG, avendo un range di tensione inferiore, l'aumento di TDP in base al Vcore dovrebbe essere ancora inferiore, con un guadagno più marcato in frequenza.

Il 32nm SOI avendo un range da 0,8V a 1,3V di massimo, che poi 1,3V certamente non sarà quello massimo applicabile prima che tutto fonda (il 45nm E0 avrebbe un massimo di 1,55V, oltre si può andare ma raffreddandolo a dovere), dovrebbe avere un aumento di frequenza maggiore del 45nm a parità di aumento di tensione.
Come dire... il 45nm con +0,05V aumenta di 200MHz? Il 32nm HKMG con lo stesso aumento di Vcore potrebbe dare +400MHz.
Di qui, se nella selezione AMD applicherebbe 95W ad esempio ad un X8 che "lavorerebbe" a 1,1V (esempio), magari il procio con un silicio "migliore", potrebbe ad esempio, sempre a 1,1V, essere 4GHz. Un po' come un 1055T a 1,3V è 125W TDP a 2,8GHz, ed un 1090T, sempre a 1,3V 3,2GHz allo stesso TDP.
Così a naso...qualcosa non mi quadra.

Se fosse realmente come hai prospettato...stabilendo che a 3,5Ghz abbiamo un Vcore di 0,8...portandolo a 1,3...dovremmo raggiungere la velocità della luce già a stock...e per l'aggiunta...pure su un x8

Essendo il 32nm "nuovo" per AMD...penso che gli incrementi di vcore diano un risultato meno che proporzionale in frequenza. da qui 1,3V che potrebbero servire per superare agevolmente i 4Ghz a stock.

Con un silicio e step migliori...si avrebbero i medesimi risultati...ma con un range proporzionalmente inferiore tipo 0,6-1V...nel qual caso, naturalmente con 1,3V si supererebbero agevolmente i 5Ghz con adeguato raffreddamento.

Lietissimo di essere contraddetto in tutto e per tutto
__________________
X79A-GD45 , 3820K , 32Gb G.SKILL 2400, Sapphire 5850 , Antec 650W, HP 27ES
dany700 è offline  
Old 24-11-2010, 13:24   #5538
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da dany700 Guarda i messaggi
Così a naso...qualcosa non mi quadra.

Se fosse realmente come hai prospettato...stabilendo che a 3,5Ghz abbiamo un Vcore di 0,8...portandolo a 1,3...dovremmo raggiungere la velocità della luce già a stock...e per l'aggiunta...pure su un x8

Essendo il 32nm "nuovo" per AMD...penso che gli incrementi di vcore diano un risultato meno che proporzionale in frequenza. da qui 1,3V che potrebbero servire per superare agevolmente i 4Ghz a stock.

Con un silicio e step migliori...si avrebbero i medesimi risultati...ma con un range proporzionalmente inferiore tipo 0,6-1V...nel qual caso, naturalmente con 1,3V si supererebbero agevolmente i 5Ghz con adeguato raffreddamento.

Lietissimo di essere contraddetto in tutto e per tutto
0,8 volt di vcore dovrebbe essere il voltaggio in idle della cpu (frequenza bassa grazie al c&q e molte parti della cpu spente.
Bisogna vedere se 1,3v è il voltaggio senza turbo attivo o quello con il turbo (che potrebbe anche coincidere anche se ci credo poco)
Ares17 è offline  
Old 24-11-2010, 13:36   #5539
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Originariamente inviato da Pihippo Guarda i messaggi
Ciao
Mi permetto di dire una cosa, in ambiente server, sopratutto se multithreaded (come il 98% delle applicazioni server) la dimensione ha un impatto minore rispetto ad un ambiente dekstop, in quanto essendoci al max 2 thread che devono compiere una marea di cose (caso giochino thread rendering + thread misto I\O fisica ai audio e corbellerie varie) tendono a tassare di più una L2 di tipo privato per core (come quella dei k10 e dei nehalem)
Ad esempio vedi le ottime prestazioni che hanno tuttora i c2q nei giochini non fortemente multithreaded, questo grazie alla loro enorme L2 condivisa
Ciao,
Non mi sembra proprio che le performance (nei giochini) single thread di westmere siano migliori di quelle del nahalem, sebbene abbia più cache L3 (8vs12).

Ultima modifica di Ren : 24-11-2010 alle 13:39.
Ren è offline  
Old 24-11-2010, 13:42   #5540
dany700
Senior Member
 
Iscritto dal: Dec 2005
Messaggi: 1113
Quote:
Originariamente inviato da Pihippo Guarda i messaggi
Ciao
Bd è molto throughput oriented come hai ben potuto notare.
Le dimensioni della L3 di sb sono aumentate per coprire la piccola dimensione della L2. Quello che realmente conta comunque oltre alla dimensioni, è la load to use latency, ovvero trovato ciò che mi serve quanto impiego per portarlo alle execution unit, e nel caso di un accesso alla L2 in sb si parla di circa 10 cicli, molto ben mascherabili dall'hardware. Mascherabili nel senso che in quei 10 cicli hai qualcos'altro da fare nel frattempo che ti arrivi l'operando contenuto nella L2.
grazie della spiegazione

rimane solo da vedere nella realtà delle apllicazioni...come si tradurrano entrambe le architetture...vista la loro estrema etereogeneità.

infatti se SB ha una L2 a 10 cicli con un'ampiezza di 256Kb oltre a godere di un IPC superiore a BD (così si legge in giro...15-20%??)...resta da capire quanto potrà rispondere a BD con una L2 da 1MB...che a prescindere dai cicli, potrebbe colmare agevolmente il gap in termini di un eventuale minore IPC in termini di calcolo puro.

Così a spanne...non credo si possano confrontare facilmente a livello di ST o moderati MT...la differenza di L2 è enorme e a vantaggio di BD, benchè sia ancora tutto sulla carta.

in MT complessi...invece...fare delle congetture accurate in mancanza di test che dimostrino efficienze architetturali empiriche di una o dell'altra...non credo sia ancora possibile.

mi riferisco ai proci in senso assoluto a parità di core, oppure a coppie di core contro un modulo e così via...e non certo considerando il rapporto performance/prezzo...naturalmente.
__________________
X79A-GD45 , 3820K , 32Gb G.SKILL 2400, Sapphire 5850 , Antec 650W, HP 27ES
dany700 è offline  
 Discussione Chiusa


Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza Sottile, leggero e dall'autonomia WOW: OPPO Reno...
Destiny Rising: quando un gioco mobile supera il gioco originale Destiny Rising: quando un gioco mobile supera il...
Plaud Note Pro convince per qualità e integrazione, ma l’abbonamento resta un ostacolo Plaud Note Pro convince per qualità e int...
Tamron 25-200mm F/2.8-5.6 Di III VXD G2:...
Il rover NASA VIPER arriverà sull...
Il MagSafe Battery Pack ha la stessa bat...
Il tri-fold di Samsung sta arrivando e s...
Prezzi a picco su Amazon nel weekend: 25...
6 accessori Amazon per pulire in maniera...
Tesla riprogetterà le sue iconich...
iPhone 17 Pro e Pro Max, eccoli tutti su...
Amazon abbatte il prezzo: scopa elettric...
Super sconti Amazon: 5 ottimi smartphone...
iPhone Air non è solo sottile: &e...
Energia in Italia ad agosto: consumi in ...
SpaceX guarda ai primi voli orbitali del...
Il prototipo del razzo spaziale riutiliz...
Blue Origin mostra uno spettacolare vide...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 17:56.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v