Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Questo mouse ultraleggero, con soli 36 grammi di peso, è stato concepito per offrire un'esperienza di gioco di alto livello ai professionisti degli FPS, grazie al polling rate a 8.000 Hz e a un sensore ottico da 33.000 DPI. La recensione esplora ogni dettaglio di questo dispositivo di gioco, dalla sua agilità estrema alle specifiche tecniche che lo pongono un passo avanti
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Dal richiamo di Enrico Letta alla necessità di completare il mercato unico entro il 2028 alla visione di Nokia sul ruolo dell’IA e delle reti intelligenti, il Nokia Innovation Day 2025 ha intrecciato geopolitica e tecnologia, mostrando a Vimercate come la ricerca italiana contribuisca alle sfide globali delle telecomunicazioni
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
OPPO Reno14 F 5G si propone come smartphone di fascia media con caratteristiche equilibrate. Il device monta processore Qualcomm Snapdragon 6 Gen 1, display AMOLED da 6,57 pollici a 120Hz, tripla fotocamera posteriore con sensore principale da 50MP e generosa batteria da 6000mAh con ricarica rapida a 45W. Si posiziona come alternativa accessibile nella gamma Reno14, proponendo un design curato e tutto quello che serve per un uso senza troppe preoccupazioni.
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 03-10-2010, 20:35   #3781
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Facciamo un attimo di riflessione:

Comunque, non c'è correlazione tra la frase di AMD "proporremo TH fisici a TH logici" in un procio che con 4 moduli può gestire al max 8 TH contro già un i7 980X che ne può gestire 12.

Le uniche uscite da questo ragionamento che vedrei sono 2:

1a
-------------------------------------------------------------------
che l'affermazione sia per l'ambito server: SB X8 con 16 TH = BD X16.
Per il desktop rimane solo BD X8, magari reputandolo già sufficiente almeno sino all'arrivo di SB X8 previsto sul finire anno prox.
Nel momento in cui Intel proporrà un X10, tra affinamenti e quant'altro, penso probabile che AMD proporrà un BD X10 e a quel punto non credo problematica l'"emigrazione" pure nel desktop.
--------------------------------------------------------------------

2a.
Il desktop, ha altre prerogative.

E' importante l'IPC del singolo core (ed in questo l'esempio è l'i7 e successivamente SB, in questo Intel al momento è nettamente prima).

Se BD incrementa l'IPC singolo core, facendo lavorare il modulo come X1, risolve ampiamente il problema, aiutato inoltre dal clock di per sé almeno del 25-30% superiore a quello Intel.

Il numero di TH è secondario... e comunque, diciamo che AMD anche con un numero di TH inferiore, essendo i TH fisici, non ha problemi a contrastare un numero di TH superiore da parte di Intel, visto che sono logici ma che si basano su n core logici/2 = core fisici, quindi anche in caso di SB X6 e X8, che comunque arriveranno sul finire anno prox., AMD avrebbe tutto il tempo sia per un nuovo step di silicio, sia per aggiungere il low-k se non presente all'uscita, e, tra CTI e processo a regime, miglioramenti di TDP tali da permettere l'aggiunta di 2 core non vedrei il tutto problematico.

Inoltre, il desktop può contare su clock sicuramente più alti che nel server, può contare su proci B.E. per la gioia di tutti.... ci mancherebbe solo un listino alla Thuban e vivremmo tutti felici e contenti.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593

Ultima modifica di paolo.oliva2 : 03-10-2010 alle 20:38.
paolo.oliva2 è offline  
Old 03-10-2010, 20:44   #3782
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
Ci ho pensato durante tutto il pomerigio:
Per aumentare l'ipc in monoth basterebbe che in caso di prediction fault invece di attendere lo svuotamento delle pipeline prima di inserire altri dati da elaborare si manda il tutto in esecuzione sull'altro core (abbassando di molto le latenze).
Questo potrebbe permettere un doppio vantaggio:
utilizzare algoritmi di prefech più spinti e al tempo stesso riddurre di molto i cicli di attesa in caso di fetch fault.
Questo porterebbe il guadagno di ipc ad una notevole impennata (tra un fetch aggressivo ed una notevole tolleranza all'errore, senza peraltro innalzare di un solo watt il tdp del singolo modulo.
Potrebbe sembrare FS, ma credo che con una struttura logica come quella imputata a Bd sia più che possibile e senza le controindicazioni dei processi multith che generalmente sono abbastanza prevedibili limitando le latenze dovute a fetch fault.
Se ho detto una cassanata scusatemi.
Per me siamo nella strada giusta e l'abbiamo nasata molto bene... In fin dei conti il TH del Capitano è sempre stato nelle prime posizioni in fatto di nasate Vi ricordate quella dell'E0 del Thuban?

Inoltre... JF con quel 13% in più... non è attendibile nel desktop, perché lui parlava di server, quindi tutto il "nostro" discorso che si basa sul modulo inteso come X1 esula dalla sua affermazione.
Per finire... se cominciano ad essere sempre di più chi afferma che a parità di clock BD sarà sotto ma di poco a SB, ciò è ottenibile unicamente con sopra il 30% di IPC, cosa che mi sembra non sia giustificata da un INT in più e una doppia FP e L2 da 2MB. Un qualche cosa ci deve essere, e penso sia quella che abbiamo nasato....
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 03-10-2010, 20:45   #3783
Megakirops
Senior Member
 
L'Avatar di Megakirops
 
Iscritto dal: Jul 2006
Messaggi: 1071
Appoggio Gigamez, infatti l'argomento non è nuovo ma ne parlammo già nel mese di luglio, e fui proprio io ad avanzarla

Sono ancora convinto che ci sarà la sorpresa dei BD X4/4moduli/8thread fisici ed X8/8moduli/16thread fisici che però all'occorrenza possono lavorare solo su 4 ed 8 thread rispettivamente nel caso di programmi poco propensi al multi-thread in modo da ottimizzare le risorse.
__________________
1°Pc: AMD Athlon II X4 630@3.4GHz - Asus M4A78T-E-2*2gb Kingston ddr3 1333MHz CL9@1620MHz 7-8-8-20-1T - SAPPHIRE HD4850 512mb - hd Segate sata2 400gb-hd maxtor ide 80gb-Ali modulare Perdoon 500W - IIYAMA ProLite B2403WS
2°Pc: AMD Opteron 1210- MSI K9AGM3-2*1Gb ddr2 800mhz Corsair xms2 DHX-hd WD 160gb-X850XT PE
Megakirops è offline  
Old 03-10-2010, 20:56   #3784
Heimdallr
Senior Member
 
L'Avatar di Heimdallr
 
Iscritto dal: Feb 2010
Città: Fabriano
Messaggi: 1096
comunque i SB di fascia alta su lga 2011 sono previsti per il Q3 2011, quindi BD dovrà fronteggiarli ben presto dopo la sua uscita.
Heimdallr è offline  
Old 03-10-2010, 21:05   #3785
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
Ci ho pensato durante tutto il pomerigio:
Per aumentare l'ipc in monoth basterebbe che in caso di prediction fault invece di attendere lo svuotamento delle pipeline prima di inserire altri dati da elaborare si manda il tutto in esecuzione sull'altro core (abbassando di molto le latenze).
Questo potrebbe permettere un doppio vantaggio:
utilizzare algoritmi di prefech più spinti e al tempo stesso riddurre di molto i cicli di attesa in caso di fetch fault.
Questo porterebbe il guadagno di ipc ad una notevole impennata (tra un fetch aggressivo ed una notevole tolleranza all'errore, senza peraltro innalzare di un solo watt il tdp del singolo modulo.
Potrebbe sembrare FS, ma credo che con una struttura logica come quella imputata a Bd sia più che possibile e senza le controindicazioni dei processi multith che generalmente sono abbastanza prevedibili limitando le latenze dovute a fetch fault.
Se ho detto una cassanata scusatemi.
In linea teorica potrebbe funzionare.. ma non hai tenuto conto di una cosa: quando le pipeline vanno in prediction fault la vera perdita di tempo sta nel ricercare il dato o il salto che non era stato predetto. Pur avendo due cores INT questa ricerca deve comunque essere effettuata! Una volta trovata una soluzione che tu risolva l'istruzione sul core 0 (con pipelines in stallo) o sul core 1 (totalmente in idle), non cambia molto a parte appunto el latenze.. un po' poco per giustificare un CORE aggiuntivo, non credi? Insomma: il guadagno prestazionale in un'ipotesi di questo tipo sarebbe davvero molto limitato.. a meno che non si ragioni in un'ottica SMT tipo Intel HT, dove una volta che si raggiunge una condizione di stallo lo scheduler "passa la palla" direttamente su un altro thread (il famoso thread "logico") per tenere comunque impegnate le pipelines e le executions durante l'attesa dovuta a cercare il "pezzo mancante".
Effettivamente funzionerebbe un pò meglio in un'ottica "intel HT", "saltando" sul secondo core solamente quando il primo core attende qualcosa e va in stallo. Sarebbe tuttavia estremamente poco efficiente avere un core FISICO chiamato in causa solamente nelle situazioni di fallimento, e quindi con un utilizzo molto distante dal massimo teorico (100%), non credi?

Sarebbe di certo piu' conveniente a livello di ottimizzazione ed utilizzo delle risorse (avendo due veri e propri cores FISICI) creare due threads (permettetemi il gioco di parole) "logici" partendo da un unico "thread fisico"!
Mi spiego: intendo "threads logici" in quanto a partire da un'unico thread "fisico" (il vero e proprio programma "monocore") si dovrebbero creare due percorsi logici di micro-ops da eseguire simultaneamente nei due cores INT.
Ecco che pero' arriviamo alla mia precedente ipotesi, non credi?
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935
Gigamez è offline  
Old 03-10-2010, 21:14   #3786
Athlon
Senior Member
 
Iscritto dal: Oct 1999
Messaggi: 3780
il prediction fault si avvera quando una istruzione condizionale ha un risultato diverso da quello predetto.

Di norma questo avviene all' uscita dai loop , se ho un loop che per 100 volte ha continuato a girare la branch prediction prevedera' che anche alla 101 esecuzione dopo l'istruzione condizionale vennga eseguita una determinata istruzione e quindi manda in pipeline questa istruzione prima ancora che venga completata l'esecuzione dell' istruzione condizionale.

L'idea proposta e' che nel caso di istruzioni condizionali un core int eseguirebe il ramo (true) mentre l'altro il ramo (false) , in questo modo indipendentemente dal risultato della condizionale ci sarebbe comunque un core gia' pronto con i dati correti in pipeline.


A mio parere pero' questa soluzione sebbene permetta di migliorare le performance non e' una risposta intelligente perche' raddoppia il consumo elettrico e perche' impedisce ad un unita' Int di occuparsi di altro ( o di stare spenta in idle)
__________________
CIAO FABRIZIO .. CORRI TRA LE NUVOLE COME FOSSERO DUNE
Athlon è offline  
Old 03-10-2010, 21:20   #3787
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Gigamez Guarda i messaggi
Mi spiego: intendo "threads logici" in quanto a partire da un'unico thread "fisico" (il vero e proprio programma "monocore") si dovrebbero creare due percorsi logici di micro-ops da eseguire simultaneamente nei due cores INT.
Ecco che pero' arriviamo alla mia precedente ipotesi, non credi?
mi quoto per semplificare AL MASSIMO cosa intendo con la mia ipotesi (permettetemi qualche licenza tecnica, hehe):

immaginate una sorta di "SLI/crossfire" tra due unità INT: nel multi GPU, la scena da renderizzare e' la stessa, ma un frame viene dato in pasto alla prima GPU, e durante l'esecuzione di questi calcoli viene dato il frame successivo alla seconda GPU, avvicinandosi ad un guadagno vicino a quello teorico, nel migliore dei casi.
Ora.. immaginate la stessa cosa, ma tra le due unità INT: Il thread da eseguire e' lo stesso, ma una micro-op viene data in pasto alla prima unità INT, e durante l'esecuzione dei calcoli viene data la micro-op successiva alla seconda unità INT. Molto semplice, ma potrebbe anche funzionare, no? Magari si spiegano anche quelle 4 unita' di decode ed il fetch unificato nei moduli..

Tutte ipotesi, ehhhh XD
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935

Ultima modifica di Gigamez : 03-10-2010 alle 21:27.
Gigamez è offline  
Old 03-10-2010, 21:24   #3788
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Athlon Guarda i messaggi
il prediction fault si avvera quando una istruzione condizionale ha un risultato diverso da quello predetto.

Di norma questo avviene all' uscita dai loop , se ho un loop che per 100 volte ha continuato a girare la branch prediction prevedera' che anche alla 101 esecuzione dopo l'istruzione condizionale vennga eseguita una determinata istruzione e quindi manda in pipeline questa istruzione prima ancora che venga completata l'esecuzione dell' istruzione condizionale.

L'idea proposta e' che nel caso di istruzioni condizionali un core int eseguirebe il ramo (true) mentre l'altro il ramo (false) , in questo modo indipendentemente dal risultato della condizionale ci sarebbe comunque un core gia' pronto con i dati correti in pipeline.


A mio parere pero' questa soluzione sebbene permetta di migliorare le performance non e' una risposta intelligente perche' raddoppia il consumo elettrico e perche' impedisce ad un unita' Int di occuparsi di altro ( o di stare spenta in idle)
infatti: potrebbe avere senso, ma ricadremmo comunque nel caso di uno spreco di risorse davvero notevole, distanziando di troppo il massimo teorico ottenibile da due cores INT (ovvero il doppio di prestazione sugli interi). Secondo me un'ottica di questo tipo e' quasi inutile e porterebbe infatti piu' svantaggi (consumo e calore maggiori) che vantaggi (limitatissimi al solo caso di appunto fallimento)
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935

Ultima modifica di Gigamez : 03-10-2010 alle 21:36.
Gigamez è offline  
Old 03-10-2010, 22:03   #3789
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da Gigamez Guarda i messaggi
In linea teorica potrebbe funzionare.. ma non hai tenuto conto di una cosa: quando le pipeline vanno in prediction fault la vera perdita di tempo sta nel ricercare il dato o il salto che non era stato predetto. Pur avendo due cores INT questa ricerca deve comunque essere effettuata! Una volta trovata una soluzione che tu risolva l'istruzione sul core 0 (con pipelines in stallo) o sul core 1 (totalmente in idle), non cambia molto a parte appunto el latenze.. un po' poco per giustificare un CORE aggiuntivo, non credi? Insomma: il guadagno prestazionale in un'ipotesi di questo tipo sarebbe davvero molto limitato.. a meno che non si ragioni in un'ottica SMT tipo Intel HT, dove una volta che si raggiunge una condizione di stallo lo scheduler "passa la palla" direttamente su un altro thread (il famoso thread "logico") per tenere comunque impegnate le pipelines e le executions durante l'attesa dovuta a cercare il "pezzo mancante".
Effettivamente funzionerebbe un pò meglio in un'ottica "intel HT", "saltando" sul secondo core solamente quando il primo core attende qualcosa e va in stallo. Sarebbe tuttavia estremamente poco efficiente avere un core FISICO chiamato in causa solamente nelle situazioni di fallimento, e quindi con un utilizzo molto distante dal massimo teorico (100%), non credi?

Sarebbe di certo piu' conveniente a livello di ottimizzazione ed utilizzo delle risorse (avendo due veri e propri cores FISICI) creare due threads (permettetemi il gioco di parole) "logici" partendo da un unico "thread fisico"!
Mi spiego: intendo "threads logici" in quanto a partire da un'unico thread "fisico" (il vero e proprio programma "monocore") si dovrebbero creare due percorsi logici di micro-ops da eseguire simultaneamente nei due cores INT.
Ecco che pero' arriviamo alla mia precedente ipotesi, non credi?
Attenzione tutto quello che ho ipotizzato prima dovrebbe corrispondere ad un + 5-7% sul totale dovuto sopratutto ad un prefech più aggressivo scortato da una bassa latenza ( all'incirca 4 cicli contro i 7, in media) in monoth.
Se ho abbastanza thread da riempire i singoli core questo reverseht non avrebbe luogo, mentre in caso di inattività innalzerebbe l'ipc del singolo th perchè eseguito alternativamente sui due core.
Sul discorso delle micro-ops credo che si avrebbero problemi di latenza nel gestire la cache L1 del singolo core (che anche se in presenza di cache esclusiva porterebbe danno il non utilizzarla)
Ares17 è offline  
Old 03-10-2010, 22:05   #3790
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da Gigamez Guarda i messaggi
infatti: potrebbe avere senso, ma ricadremmo comunque nel caso di uno spreco di risorse davvero notevole, distanziando di troppo il massimo teorico ottenibile da due cores INT (ovvero il doppio di prestazione sugli interi). Secondo me un'ottica di questo tipo e' quasi inutile e porterebbe infatti piu' svantaggi (consumo e calore maggiori) che vantaggi (limitatissimi al solo caso di appunto fallimento)
e se le prediction fault fossero il 30% sul totale?
Ares17 è offline  
Old 03-10-2010, 22:28   #3791
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
Attenzione tutto quello che ho ipotizzato prima dovrebbe corrispondere ad un + 5-7% sul totale dovuto sopratutto ad un prefech più aggressivo scortato da una bassa latenza ( all'incirca 4 cicli contro i 7, in media) in monoth.
Se ho abbastanza thread da riempire i singoli core questo reverseht non avrebbe luogo, mentre in caso di inattività innalzerebbe l'ipc del singolo th perchè eseguito alternativamente sui due core.
Sul discorso delle micro-ops credo che si avrebbero problemi di latenza nel gestire la cache L1 del singolo core (che anche se in presenza di cache esclusiva porterebbe danno il non utilizzarla)
uhm.. allora mi sa che non ho capito bene cosa intendi: praticamente la tua ipotesi si basa su un qualcosa di "misto" ed alternativo tra un SMT ed un vero modulo "dualcore"?
No, perche' se fosse solamente come SMT avresti appunto un guadagno molto piccolo, e se fosse un vero dualcore penso proprio non dovresti avere unita' come fetch e branch prediction in comune..

Quote:
e se le prediction fault fossero il 30% sul totale?
Teoricamente pensando al solo branch prediction avresti comunque un guadagno prestazionale <= al 30% rispetto alla singola unità int, quindi comunque troppo distante da quello teorico che l'unità aggiuntiva potrebbe darti (100%, appunto). E quando invece hai dei successi? Lasci il secondo core in idle o lo fai comunque lavorare inutilmente per qualcosa che poi non servirà (consumando comunque e producendo calore)? Gli daresti in pasto qualcos'altro quando non ci sono dei "trees" da gestire? in questo caso con quali unità di fetch e decode potresti fare una cosa simile, visto che quelle condivise starebbero gia' lavorando per il primo core? :S
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935

Ultima modifica di Gigamez : 03-10-2010 alle 22:33.
Gigamez è offline  
Old 03-10-2010, 22:47   #3792
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da Gigamez Guarda i messaggi
uhm.. allora mi sa che non ho capito bene cosa intendi: praticamente la tua ipotesi si basa su un qualcosa di "misto" ed alternativo tra un SMT ed un vero modulo "dualcore"?
No, perche' se fosse solamente come SMT avresti appunto un guadagno molto piccolo, e se fosse un vero dualcore penso proprio non dovresti avere unita' come fetch e branch prediction in comune..


Teoricamente pensando al solo branch prediction avresti comunque un guadagno prestazionale <= al 30% rispetto alla singola unità int, quindi comunque troppo distante da quello teorico che l'unità aggiuntiva potrebbe darti (100%, appunto). E quando invece hai dei successi? Lasci il secondo core in idle o lo fai comunque lavorare inutilmente per qualcosa che poi non servirà (consumando comunque e producendo calore)? Gli daresti in pasto qualcos'altro quando non ci sono dei "trees" da gestire? in questo caso con quali unità di fetch e decode potresti fare una cosa simile, visto che quelle condivise starebbero gia' lavorando per il primo core? :S
onestamente preferisco avere un +5% ipc in mono th usando i core alternandoli nei calcoli (solo nel caso il numero di th in esecuzione siano inferiori al numero dei core) con peso 0 watt che +20% di ipc con peso di 5W (non dimentichiamoci che un core int è solo il 12% di un modulo, quindi l'utilizzarlo porta ad al massimo + 8% di W in più, considerando che per la struttura del modulo il singolo core non viene spento e nemmeno rallentato
ma semplicemente lasciato in c1 state)
Ares17 è offline  
Old 03-10-2010, 22:56   #3793
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
onestamente preferisco avere un +5% ipc in mono th usando i core alternandoli nei calcoli (solo nel caso il numero di th in esecuzione siano inferiori al numero dei core) con peso 0 watt che +20% di ipc con peso di 5W (non dimentichiamoci che un core int è solo il 12% di un modulo, quindi l'utilizzarlo porta ad al massimo + 8% di W in più, considerando che per la struttura del modulo il singolo core non viene spento e nemmeno rallentato
ma semplicemente lasciato in c1 state)
vabbe', ma allora perche' fare un core fisico quando usando un SMT si potrebbe avere una prestazione aggiunta a volte anche molto maggiore dell'8% (senza nemmeno avere quel seppur piccolo 8% di consumo in +)?
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935
Gigamez è offline  
Old 03-10-2010, 23:11   #3794
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da Gigamez Guarda i messaggi
vabbe', ma allora perche' fare un core fisico quando usando un SMT si potrebbe avere una prestazione aggiunta a volte anche molto maggiore dell'8% (senza nemmeno avere quel seppur piccolo 8% di consumo in +)?
ecco dove sbagli.
Io non faccio un core fisico in più per avere un 8% in più di ipc.
Io faccio un core in più per avere un thread reale in più, ma che quando questo sta a rigirarsi i pollici lo uso per avere un ipc maggiore del 5-8-20% (quello che sia insomma) prendendolo in prestito.
4 moduli possono essere visti come 8 core reali in ambito multi th o come 4 supercore in ambito single th.
L'SMT di intel dal canto suo utilizza i tempi morti dovuti a codice malamente ottimizzato per poter raddoppiare i th logici.
Per curiosità domani provo a lanciare un cinebench su i7 975 senza smt attivo (con smt on ho 6,02) per vedere la perdita di performance in sua assenza.
Ares17 è offline  
Old 03-10-2010, 23:26   #3795
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
ecco dove sbagli.
Io non faccio un core fisico in più per avere un 8% in più di ipc.
Io faccio un core in più per avere un thread reale in più, ma che quando questo sta a rigirarsi i pollici lo uso per avere un ipc maggiore del 5-8-20% (quello che sia insomma) prendendolo in prestito.
4 moduli possono essere visti come 8 core reali in ambito multi th o come 4 supercore in ambito single th.
L'SMT di intel dal canto suo utilizza i tempi morti dovuti a codice malamente ottimizzato per poter raddoppiare i th logici.
Per curiosità domani provo a lanciare un cinebench su i7 975 senza smt attivo (con smt on ho 6,02) per vedere la perdita di performance in sua assenza.
ecco allora che ho capito cosa intendevi: una sorta di "misto" tra le due cose, appunto.
Ma come faresti a gestire un modulo come 2 cores reali (nel caso tu non debba gestire dei prediction), sapendo di avere moltissime unità condivise tra cui appunto fetch e decode?
Inoltre: ogni volta che avresti una "biforcazione" del tuo programma dovresti gestire simultaneamente le due possibili soluzioni, cosi' come faceva notare Athlon. Sarebbe veramente la cosa piu' ottimizzata, al livello di prestazioni? Non sarebbe allora piu' facile fare come ha fatto Intel, ovvero un modulo con un solo core molto potente in grado di implementare un SMT? avresti sicuramente consumi minori, costi minori, tdp minore ed ottimizzazione delle risorse hardware maggiore!
Secondo me non puo' essere questa l'ipotesi su cui si basa un modulo BD..
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935
Gigamez è offline  
Old 03-10-2010, 23:55   #3796
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24169
Ho ricevuto una notizia da confermare.
E' sotto esame il nuovo step produttivo di Llano cioè lo step B0 (quello che in pratica ha portato il posticipo a quest'estate); il primo step funzionante di Llano è stato A0....
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 04-10-2010, 00:30   #3797
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da Gigamez Guarda i messaggi
ecco allora che ho capito cosa intendevi: una sorta di "misto" tra le due cose, appunto.
Ma come faresti a gestire un modulo come 2 cores reali (nel caso tu non debba gestire dei prediction), sapendo di avere moltissime unità condivise tra cui appunto fetch e decode?
Inoltre: ogni volta che avresti una "biforcazione" del tuo programma dovresti gestire simultaneamente le due possibili soluzioni, cosi' come faceva notare Athlon. Sarebbe veramente la cosa piu' ottimizzata, al livello di prestazioni? Non sarebbe allora piu' facile fare come ha fatto Intel, ovvero un modulo con un solo core molto potente in grado di implementare un SMT? avresti sicuramente consumi minori, costi minori, tdp minore ed ottimizzazione delle risorse hardware maggiore!
Secondo me non puo' essere questa l'ipotesi su cui si basa un modulo BD..
Bd è indirizzato al mercato server (quindi niente smt attivo su intel).
Bd è massimizzato per avere le massime prestazioni in multith.
L'smt di intel occupa diciamo il 3% di superfice in relazione al core.
il 2 core occupa il 12% in relazione al modulo.
Adesso cosa ti faccia pensare che un core + smt sia più efficente in multith di un modulo?
la densita di core per superfice è nettamente a favore di bd e presumibilmente dove SB avrà 8 core reali Bd avrà almeno 6 moduli (ma forse ci sarebbe lo spazio anche per 7)
Il modulo di amd serve ad aumentare la densità dei core.
Tutto il discorso sul reverse HTT sono solo speculazioni e se questo fosse reale sarebbe solo un opzional (che peraltro sarebbe del tutto inutile in ambito server)
Ares17 è offline  
Old 04-10-2010, 00:30   #3798
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
Ho ricevuto una notizia da confermare.
E' sotto esame il nuovo step produttivo di Llano cioè lo step B0 (quello che in pratica ha portato il posticipo a quest'estate); il primo step funzionante di Llano è stato A0....
Mi sa proprio che sia il... low-k.

Se fosse il 32nm liscio, da A0 dovrebbe passare ad A1.
B0, cioè cambiare la lettera iniziale, dovrebbe essere un cambio radicale di trattamento, cioé... dovrebbe equivalere all'introduzione low-k.

(vedi Soi 45nm C2, C3... altro trattamento D0 D1, introduzione low-k E0).

Se proprio non fosse il low-k, comunque dovrebbe essere qualche cosa di importante, visto il posticipo.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 04-10-2010, 00:33   #3799
Gigamez
Senior Member
 
L'Avatar di Gigamez
 
Iscritto dal: Dec 2008
Città: Milano
Messaggi: 512
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
Bd è indirizzato al mercato server (quindi niente smt attivo su intel).
Bd è massimizzato per avere le massime prestazioni in multith.
L'smt di intel occupa diciamo il 3% di superfice in relazione al core.
il 2 core occupa il 12% in relazione al modulo.
Adesso cosa ti faccia pensare che un core + smt sia più efficente in multith di un modulo?
la densita di core per superfice è nettamente a favore di bd e presumibilmente dove SB avrà 8 core reali Bd avrà almeno 6 moduli (ma forse ci sarebbe lo spazio anche per 7)
Il modulo di amd serve ad aumentare la densità dei core.
Tutto il discorso sul reverse HTT sono solo speculazioni e se questo fosse reale sarebbe solo un opzional (che peraltro sarebbe del tutto inutile in ambito server)
uhm.. mi sa che ora sei tu a non aver capito cosa intendo io.. ma te lo spiego bene domani: ora vado a dormire! XD
__________________
Case Cooler Master NR200P | M/B Asus Strix x470i gaming itx | Proc AMD Ryzen 5800X3D | RAM Corsair Veng. 32Gb DDR4 3000 cl15 | GPU Gigabyte nVidia 1080ti OC | Ali Cooler Master SFX 850w | SSD Crucial MX300 m.2 1Tb | Dissi Artic Liquid Freezer II | Monitor AOC Agon AG271QG (gSync ON) | Keyboard Logitech g915 | Mouse Logitech g502 | Audio Logitec g935
Gigamez è offline  
Old 04-10-2010, 00:47   #3800
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
Bd è indirizzato al mercato server (quindi niente smt attivo su intel).
Bd è massimizzato per avere le massime prestazioni in multith.
L'smt di intel occupa diciamo il 3% di superfice in relazione al core.
il 2 core occupa il 12% in relazione al modulo.
Adesso cosa ti faccia pensare che un core + smt sia più efficente in multith di un modulo?
la densita di core per superfice è nettamente a favore di bd e presumibilmente dove SB avrà 8 core reali Bd avrà almeno 6 moduli (ma forse ci sarebbe lo spazio anche per 7)
Il modulo di amd serve ad aumentare la densità dei core.
Tutto il discorso sul reverse HTT sono solo speculazioni e se questo fosse reale sarebbe solo un opzional (che peraltro sarebbe del tutto inutile in ambito server)
Quoto.
Il problema di AMD è quello di recuperare IPC nel monocore in desktop.
Nell'ambito server praticamente sarebbe bastato portare un Magny-C sul 32nm per guadagnare quei 0.5-1GHz di clock.

BD diciamo che sarebbe ottimizzato per sfruttare il 32nm sia sul lato clock (con pipeline idonee) che sul lato monocore inteso come IPC.

Inoltre aggiungerei una cosa... da notare che il livello di spegnimento core è inteso a livello di modulo. Quindi viene da sé che coinciderebbe con l'ipotesi di modulo visto come 1 super-core nel caso il modulo non debba servire 2 TH ma 1 TH.

E poi, semplificando, abbiamo visto che il modulo con sia l'INT in più che la FP raddoppiata sono un'ottimizzazione per ridurre la superficie del die ed ottimizzare il TDP/IPC al massimo.
Ma questo non toglie che se il modulo lavora con 1 singolo TH, praticamente avrebbe a quel punto un raddoppio di INT ed una FP doppia.
Il TDP non importerebbe, perché comunque non può arrivare al livello di 2 core che funziano.
Insomma, anche senza complicarci la vita con 2 pipeline simultanee o qualsivoglia, mi pare innegabile che un modulo fatto lavorare con 1 TH sarebbe un super-core.

Oltretutto, riducendo lo spazio a modulo (per 2 core), la potenza del multicore si troverebbe sempre e ugualmente semplicemente perché con meno TDP e con meno spazio a die, aggiungere più moduli risulterebbe comunque cosa facile.

Con questo non è che dico che Gigamez abbia torto... cerco soltanto di semplificare il concetto.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
 Discussione Chiusa


Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza Sottile, leggero e dall'autonomia WOW: OPPO Reno...
Destiny Rising: quando un gioco mobile supera il gioco originale Destiny Rising: quando un gioco mobile supera il...
Plaud Note Pro convince per qualità e integrazione, ma l’abbonamento resta un ostacolo Plaud Note Pro convince per qualità e int...
Tamron 25-200mm F/2.8-5.6 Di III VXD G2:...
Il rover NASA VIPER arriverà sull...
Il MagSafe Battery Pack ha la stessa bat...
Il tri-fold di Samsung sta arrivando e s...
Prezzi a picco su Amazon nel weekend: 25...
6 accessori Amazon per pulire in maniera...
Tesla riprogetterà le sue iconich...
iPhone 17 Pro e Pro Max, eccoli tutti su...
Amazon abbatte il prezzo: scopa elettric...
Super sconti Amazon: 5 ottimi smartphone...
iPhone Air non è solo sottile: &e...
Energia in Italia ad agosto: consumi in ...
SpaceX guarda ai primi voli orbitali del...
Il prototipo del razzo spaziale riutiliz...
Blue Origin mostra uno spettacolare vide...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 00:05.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v