Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Hisense A85N: il ritorno all’OLED è convincente e alla portata di tutti
Hisense A85N: il ritorno all’OLED è convincente e alla portata di tutti
Dopo alcuni anni di assenza dai cataloghi dei suoi televisori, Hisense riporta sul mercato una proposta OLED che punta tutto sul rapporto qualità prezzo. Hisense 55A85N è un televisore completo e versatile che riesce a convincere anche senza raggiungere le vette di televisori di altra fascia (e altro prezzo)
Recensione Borderlands 4, tra divertimento e problemi tecnici
Recensione Borderlands 4, tra divertimento e problemi tecnici
Gearbox Software rilancia la saga con Borderlands 4, ora disponibile su PS5, Xbox Series X|S e PC. Tra le novità spiccano nuove abilità di movimento, un pianeta inedito da esplorare e una campagna che lascia al giocatore piena libertà di approccio
TCL NXTPAPER 60 Ultra: lo smartphone che trasforma la lettura da digitale a naturale
TCL NXTPAPER 60 Ultra: lo smartphone che trasforma la lettura da digitale a naturale
NXTPAPER 60 Ultra è il primo smartphone con tecnologia NXTPAPER 4.0 per il display, un ampio IPS da 7,2 pollici. Con finitura anti-riflesso, processore MediaTek Dimensity 7400, fotocamera periscopica e modalità Max Ink per il detox digitale, NXTPAPER 60 Ultra punta a essere il riferimento tra gli smartphone pensati per il benessere degli occhi.
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 31-08-2010, 10:48   #2501
Ares17
Bannato
 
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
Quote:
Originariamente inviato da cionci Guarda i messaggi
Difficilmente potrà avere un IPC maggiore del 20% sugli int rispetto ad un dual core K10...
Mi sa che Paolo faccia confusione tra ipc ed istruzioni al secondo: un ipc del 20% inferiore unito ad un clock del 40% maggiore certamente ci da una capacità di calcolo maggiore.
Ares17 è offline  
Old 31-08-2010, 10:52   #2502
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da cionci Guarda i messaggi
Difficilmente potrà avere un IPC maggiore del 20% sugli int rispetto ad un dual core K10...
Ciao
Scusami, ma perchè? Solo perchè sono sol 2 agu e 2 alu? Se fosse cosi si potrebbe gia dire che nel k10 ci potevano essere 40 agu e 320 alu ma alla fine se tutto andava bene ritirava tra alu-agu ed unità di fp 3 macro-op..
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 31-08-2010, 11:12   #2503
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da Pihippo Guarda i messaggi
Ciao
Scusami, ma perchè? Solo perchè sono sol 2 agu e 2 alu? Se fosse cosi si potrebbe gia dire che nel k10 ci potevano essere 40 agu e 320 alu ma alla fine se tutto andava bene ritirava tra alu-agu ed unità di fp 3 macro-op..
Stiamo parlando di un dual core K10. Quindi le istruzioni che ritira sono 6, non tre.
cionci è offline  
Old 31-08-2010, 11:32   #2504
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Ragionando su ALU e AGU, nel K10 non potevano essere occupate contemporaneamente 3 AGU e 3 ALU, perché ogni coppia di ALU e AGO condivideva parte della pipeline.
Quindi la possibilità di ritirare fino a 3 macro-ops per ciclo di clock è assolutamente ben dimensionata.

In BD, le unità AGU e ALU sono completamente distinte. Ci sono due ALU e due AGU per ogni unità di interi. In teoria per avere la possibilità di sfruttare tutte le unità di calco, dovrebbe poter ritirare ben 8 macro-ops per ciclo di clock. Ora bisogna vedere bene come sono organizzate le cose, perché questo significa che la Load/Store unit (sarà condvisa ? vedendo come è posizionata la L1 direi di no) dovrebbe essere capace di elaborare ben 8 istruzioni per ciclo di clock. Il che mi sembra un tantinello esagerato.
cionci è offline  
Old 31-08-2010, 11:33   #2505
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da cionci Guarda i messaggi
Stiamo parlando di un dual core K10. Quindi le istruzioni che ritira sono 6, non tre.
Ciao
certo, sono 6, se ci riesce, contro le probabili 8 di un modulo di bd? Non penso che il retirement buffer sia condiviso da 2 core, perchè ciò vorrebbe dire che i 2 core stanno processando lo stesso thread......
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 31-08-2010, 11:35   #2506
JDM70
Senior Member
 
L'Avatar di JDM70
 
Iscritto dal: Aug 2009
Città: Prov. Savona
Messaggi: 802
Secondo me il punto è nel capire se AMD intenderà un quad core con 2 Moduli o... 4 Moduli, io rimango dell'idea che userà 4 Moduli poi Imho!!!
__________________
-Case CMSTACKER-Corsair RM850X-Asus SABERTOOTH 990FX R2.0-AMD FX 8370 4.75Ghz 1.356V -Masterliquid 240 RGB-Corsair CMZ8GX3M2A1866C9 16GB-ASUS STRIX R9 380 4Gb-Samsung 850 Pro 256Gb-Monitor Samsung SyncMaster 2433bw-W10 64- -
27/12/10 Mi mancherai per sempre Mamma!!!
JDM70 è offline  
Old 31-08-2010, 11:39   #2507
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da cionci Guarda i messaggi
Ragionando su ALU e AGU, nel K10 non potevano essere occupate contemporaneamente 3 AGU e 3 ALU, perché ogni coppia di ALU e AGO condivideva parte della pipeline.
Quindi la possibilità di ritirare fino a 3 macro-ops per ciclo di clock è assolutamente ben dimensionata.

In BD, le unità AGU e ALU sono completamente distinte. Ci sono due ALU e due AGU per ogni unità di interi. In teoria per avere la possibilità di sfruttare tutte le unità di calco, dovrebbe poter ritirare ben 8 macro-ops per ciclo di clock. Ora bisogna vedere bene come sono organizzate le cose, perché questo significa che la Load/Store unit (sarà condvisa ? vedendo come è posizionata la L1 direi di no) dovrebbe essere capace di elaborare ben 8 istruzioni per ciclo di clock. Il che mi sembra un tantinello esagerato.
Ciao
Scusami ho visto ora il tuo ultimo post.
In effetti pare esagerato che un modulo bd possa ritirare 8 macro-op, però alla fine dei conti nehalem (ed il suo papà anche se con minor successo) riuscivano ad avvicinarsi a 4 mop ritirate per ciclo, in nehalem grazie a vari tweak e l'HT più che nei core 2. Per la L\S unit, perchè dovrebbe essere capace di elaborare 8 mop? Scusami la L\S unit si limita a caricare(load) o scrivere(store) dati\operandi sulla cache necessari per l'esecuzione di molte istruzioni. Almeno cosi è quello che ho capito.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 31-08-2010, 11:52   #2508
Lan_Di
Senior Member
 
L'Avatar di Lan_Di
 
Iscritto dal: Oct 2004
Messaggi: 2827
Quote:
Originariamente inviato da cionci Guarda i messaggi
Ragionando su ALU e AGU, nel K10 non potevano essere occupate contemporaneamente 3 AGU e 3 ALU, perché ogni coppia di ALU e AGO condivideva parte della pipeline.
Quindi la possibilità di ritirare fino a 3 macro-ops per ciclo di clock è assolutamente ben dimensionata.

In BD, le unità AGU e ALU sono completamente distinte. Ci sono due ALU e due AGU per ogni unità di interi. In teoria per avere la possibilità di sfruttare tutte le unità di calco, dovrebbe poter ritirare ben 8 macro-ops per ciclo di clock. Ora bisogna vedere bene come sono organizzate le cose, perché questo significa che la Load/Store unit (sarà condvisa ? vedendo come è posizionata la L1 direi di no) dovrebbe essere capace di elaborare ben 8 istruzioni per ciclo di clock. Il che mi sembra un tantinello esagerato.
Ti chiedo 2 cose per chiarirmi le idee.
1)Quando ti riferisci al K10, le macro ops son intese per core?
2)Per BD, le 8 sono riferite per modulo? cioè 4+4 se si ragiona dal punto di vista dei core, giusto?
Danke.
__________________
trattative a buon fine :giova22, slipknot2002, DarkSiDE, Spank, SonoJack, Giant Lizard, Jerry65, arizz, Lesto_Fante, Saich70,t1g3m4n, topolino2808, BEAR., ObiTeoKenobi, GOG.
Lan_Di è offline  
Old 31-08-2010, 11:58   #2509
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31803
Quote:
Originariamente inviato da Ares17 Guarda i messaggi
Mi sa che Paolo faccia confusione tra ipc ed istruzioni al secondo: un ipc del 20% inferiore unito ad un clock del 40% maggiore certamente ci da una capacità di calcolo maggiore.
Magari nella foga potrò anche sbagliare, ma io per IPC intendo istruzioni per clock, per potenza IPC x clock (inteso come frequenza)
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 31-08-2010, 12:04   #2510
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Ogni macro-op è una istruzione ALU/AGU/FPU + una LOAD/STORE, quindi per poter completare 8 macro-ops bisogna essere in grado di completare 8 L/S per ciclo di clock.
cionci è offline  
Old 31-08-2010, 12:05   #2511
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da Lan_Di Guarda i messaggi
Ti chiedo 2 cose per chiarirmi le idee.
1)Quando ti riferisci al K10, le macro ops son intese per core?
2)Per BD, le 8 sono riferite per modulo? cioè 4+4 se si ragiona dal punto di vista dei core, giusto?
Danke.
1) sì
2) sì
cionci è offline  
Old 31-08-2010, 12:22   #2512
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31803
Quote:
Originariamente inviato da cionci Guarda i messaggi
Come il 20% più veloce ? Se perdesse il 20% non può essere contemporaneamente il 20% più veloce.
Io intenderei questo: (oh, io ipotizzo, non ho la tua competenza e comunque cerco di capire come AMD in 5 anni stia agendo per creare un'architettura superiore al K10)

Allora... il modulo BD ha parti in condivisione, il che = -20%

Il modulo BD ha un INT in più, negli INT incrementerebbe (che poi era il punto debole verso l'i7, in quanto in FP non aveva nulla da invidiare, quindi, a livello teorico, mi sembra un passo avanti per uguagliare l'IPC nel senso totale con l'i7)

Ora, la perdita del 20% per la condivisione, non bisogna trattarla fine a sè stessa, perchè comunque comporta una diminuzione di TDP e quindi quel -20% bisogna anche proporzionarlo al clock risultante, cioé... se si perdono 20% di IPC, potrebbe pure essere che si guadagnano, a parità di silicio, forse anche il 10% di clock, quindi bisogna comunque ridimensionarla al 10%.

-------------------------

Quindi secondo me, a tutto questo, bisogna anche considerare se BD faccia ancora 3 mops a ciclo o passi a 4, bisogna vedere le latenze per ogni istruzione. Questo era il quadro precedente:



Come si cambiano le latenze io non ne ho la minima idea, ma credo che dagli schemi visti sino ad ora, nessuno può dire se siano le stesse. Comunque una L2 di 2MB condivisa nel modulo, di per sé sarebbe un bel magazzino dati, se poi fosse addirittura più aggressiva.
Poi mi viene il dubbio... con una L2 così grossa, il core è così piccolo? cacchio, comunque da 512KB+512KB di 2 core K10...

---------------------------------------------

Alla fine della minestra, entra in funzione la frequenza. Ormai dovunque attribuiscono a BD notevoli incrementi di clock.

Anche considerando un IPC inferiore nel totale, se prendiamo un Thuban 3,2Ghz stock e pensiamo ad un BD a 4GHz, saremmo sull'ordine del + 30% solo nel clock, aggiungiamoci un 33% nel numero dei core, arriveremmo a +72%. Vogliamo toglierci un 10% per minor IPC? saremmo ad un +65% ma con un procio più bilanciato nel discorso INT verso Intel e più potente di prima nell'FP.

Nel discorso monocore le cose sarebbero MOLTO migliori.
Perché il modulo di BD avrebbe l'SMT HARDWARE, quindi DOVREBBE incrementare l'IPC e non di poco rispetto al singolo core K10.
Uniscici clock sicuramente superiori di almeno 500MHz rispetto a quelli di SB... e lo scenario è fatto.

P.S.
Io non mi intendo di SMT, però vedo nel TH di Cinebench, che i proci senza SMT hanno risultati inferiore a parità di frequenza con gli i7 con SMT pure nel monocore, quindi ho teorizzato che possa aiutare pure nel monocore... e poi comunque bisogna vedere se nel modulo BD possa comunque esserci qualche miglioria.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593

Ultima modifica di paolo.oliva2 : 31-08-2010 alle 12:37.
paolo.oliva2 è offline  
Old 31-08-2010, 12:24   #2513
checo
Senior Member
 
L'Avatar di checo
 
Iscritto dal: Aug 2000
Messaggi: 17963
Quote:
Originariamente inviato da JDM70 Guarda i messaggi
Secondo me il punto è nel capire se AMD intenderà un quad core con 2 Moduli o... 4 Moduli, io rimango dell'idea che userà 4 Moduli poi Imho!!!
guarda che amd ha detto chiaramente che intende come core l'unità int quindi quad core 2 moduli.

alla fine son solo nomi
__________________
.
checo è offline  
Old 31-08-2010, 12:30   #2514
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da cionci Guarda i messaggi
Ogni macro-op è una istruzione ALU/AGU/FPU + una LOAD/STORE, quindi per poter completare 8 macro-ops bisogna essere in grado di completare 8 L/S per ciclo di clock.
Ciao
Non per forza, le macrop vengono nel k10 splittate nelle microop corrispettive(ad es macro op 1= add r.r1+store) nelle primitive micro ops (in questo caso add + load eseguite in 2 pipe diverse in modo OoO). Il retirement buffer ritira le micro ops. Scusami erroneamente ho scritto nel post precedente macro ops, negli issue slot delle alu\agu esse vengono splittate nelle micro ops, ho causato un pò di confusione
Quindi sempre prendendo per buono le minchiate che ho scritto si tretterebbe, visto che ancora dei dettagli importanti non se ne sa nulla di 4 microops ritirate per core in bd vs le 3 (magari) del k10
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 31-08-2010, 12:35   #2515
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da Pihippo Guarda i messaggi
Ciao
Sono contento che concordi, vuol dire che non ho psarato una minchiata.
BJt2 vorrei porti all'attenzione una cosa fondamentale sul discorso 3alu+3agu vs 2alu+2agu per quanto riguarda l'ipc k10vsBulldozer:
Fonte : http://www.agner.org/optimize/microarchitecture.pdf
Pag. 140:
The execution units have a much larger capacity than it is possible to utilize. It is alleged
that the nine execution units can execute nine micro-operations simultaneously, but it is
virtually impossible to verify this claim experimentally since the retirement is limited to three
macro-operations per clock cycle

Ovvero sebbene il core k10 possa fare 3 op aritmetico logiche+3op di memoria, il retirement buffer è limitato a solo 3 op per ciclo( in qualsiasi combinazione), quindi vorrebbe dire che se il retirement buffer di bd consentisse il ritiro di 4 op, bd avrebbe un vantaggio teorico del 33% sul k10.
Che ne pensi?
Esatto. E poi le 3+3 operazioni del K10 sono sempre accoppiate, ossia se una istruzione non ha l'accesso in memoria (è reg-reg) quella AGU non è utilizzata. Invece in Buldozer non esistono più macro ops e si torna alle micro ops, dove se una istruzione è reg-reg non consuma comunque una AGU. Inoltre ne K10 era possibile fare o una moltiplicazione o una divisione. Invece qui le due pipeline intere consentono di farle contemporaneamente. Questo vuol dire che una divisione (che può durare anche 40 cicli, anche se si spera che qui si sia usato un divisore migliore) non blocca le successive moltiplicazioni indipendenti...
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 31-08-2010, 12:38   #2516
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Anche considerando un IPC inferiore nel totale, se prendiamo un Thuban 3,2Ghz stock e pensiamo ad un BD a 4GHz, saremmo sull'ordine del + 30% solo nel clock, aggiungiamoci un 33% nel numero dei core, arriveremmo a +72%. Vogliamo toglierci un 10% per minor IPC? saremmo ad un +65% ma con un procio più bilanciato nel discorso INT verso Intel e più potente di prima nell'FP.
Non ho capito il passaggio evidenziato. Intendi ad un 33% dovuto al fatto di avere 4 moduli BD con 8 core logici contro i 6 core fisici del Thuban ?
Devi considerare anche il cambio di processo produttivo. Un Thuban a 32 nm girerebbe sicuramente almeno 400 Mhz più veloce con il semplice die-shrink.
Il discorso può andare bene dal punto di vista degli interi, ma sulla FPU non vedo possibile un aumento così marcato. Soprattutto se si considerano situazioni in cui i due thread dello stesso modulo eseguono entrambi istruzioni FP.
cionci è offline  
Old 31-08-2010, 12:48   #2517
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da cionci Guarda i messaggi
Non ho capito il passaggio evidenziato. Intendi ad un 33% dovuto al fatto di avere 4 moduli BD con 8 core logici contro i 6 core fisici del Thuban ?
Devi considerare anche il cambio di processo produttivo. Un Thuban a 32 nm girerebbe sicuramente almeno 400 Mhz più veloce con il semplice die-shrink.
Il discorso può andare bene dal punto di vista degli interi, ma sulla FPU non vedo possibile un aumento così marcato. Soprattutto se si considerano situazioni in cui i due thread dello stesso modulo eseguono entrambi istruzioni FP.
Se la FPU del Bulldozer può spezzare l'FMAC in 1 MUL + 1 ADD indipendenti per ciclo, la potenza è doppia, ma condivisa tra due thread, rispetto a quella del K10. Anzi, più che doppia, visto che le unità chiamate MMX si occupano dei calcoli legacy x87 e che le operazioni di memoria sono state appioppate all'unità intera.

I motivi di questa "speranza" sono molteplici: esistenza di un brevetto AMD che descrive la possibile scissione di una FMAC per fare ADD e MUL in parallelo, la inutilità di una FMAC, considerando che INTEL non ce l'ha, il codice compilato con compilatore INTEL e il codice legacy non avrà FMAC e che le XOP (che sfruttano le FMAC) non credo saranno supportate estensivamente e comunque non subito.
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!

Ultima modifica di bjt2 : 31-08-2010 alle 14:37.
bjt2 è offline  
Old 31-08-2010, 12:51   #2518
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Esatto. E poi le 3+3 operazioni del K10 sono sempre accoppiate, ossia se una istruzione non ha l'accesso in memoria (è reg-reg) quella AGU non è utilizzata. Invece in Buldozer non esistono più macro ops e si torna alle micro ops, dove se una istruzione è reg-reg non consuma comunque una AGU. Inoltre ne K10 era possibile fare o una moltiplicazione o una divisione. Invece qui le due pipeline intere consentono di farle contemporaneamente. Questo vuol dire che una divisione (che può durare anche 40 cicli, anche se si spera che qui si sia usato un divisore migliore) non blocca le successive moltiplicazioni indipendenti...
Ciao bjt2
Grazie per l'intervento, in pratica bd pur con un numero minore di ex unit sarebbe più efficiente del k10 nell'esecuzione di calcoli. Un altre cosa, anche intel splitta le macro op in micro op cosi da avere più flessibilità ed efficienza?
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 31-08-2010, 13:30   #2519
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Se la FPU del Bulldozer possa spezzare l'FMAC in 1 MUL + 1 ADD indipendenti per ciclo, la potenza è doppia, ma condivisa tra due thread, rispetto a quella del K10. Anzi, più che doppia, visto che le unità chiamate MMX si occupano dei calcoli legacy x87 e che le operazioni di memoria sono state appioppate all'unità intera.

I motivi di questa "speranza" sono molteplici: esistenza di un brevetto AMD che descrive la possibile scissione di una FMAC per fare ADD e MUL in parallelo, la inutilità di una FMAC, considerando che INTEL non ce l'ha, il codice compilato con compilatore INTEL e il codice legacy non avrà FMAC e che le XOP (che sfruttano le FMAC) non credo saranno supportate estensivamente e comunque non subito.
Quindi secondo te fonderanno le istruzioni di due thread per occupare al massimo una singola FMA, riducendo così anche la pressione sulla operazioni di memoria.

Mi viene spontaneo chiedere se i due thread basteranno ad occupare le due FMAC...

Secondo te le legacy si occuperanno dei calcoli fp non vettoriali (x87) o si limiteranno alle istruzioni intere previste dalle estensioni medesime ?
Ren è offline  
Old 31-08-2010, 13:47   #2520
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31803
Quote:
Originariamente inviato da cionci Guarda i messaggi
Non ho capito il passaggio evidenziato. Intendi ad un 33% dovuto al fatto di avere 4 moduli BD con 8 core logici contro i 6 core fisici del Thuban ?
Perché logici? BD ha 4 moduli con 2 core ciascuno... con delle parti in comune, ma sono sempre fisici.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
 Discussione Chiusa


Hisense A85N: il ritorno all’OLED è convincente e alla portata di tutti Hisense A85N: il ritorno all’OLED è convi...
Recensione Borderlands 4, tra divertimento e problemi tecnici Recensione Borderlands 4, tra divertimento e pro...
TCL NXTPAPER 60 Ultra: lo smartphone che trasforma la lettura da digitale a naturale TCL NXTPAPER 60 Ultra: lo smartphone che trasfor...
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
The Social Reckoning: il seguito di The ...
iPhone 16 si trova ora su Amazon a soli ...
Amazon fa a pezzi i prezzi dei monitor g...
Componenti hardware e periferiche PC a p...
Pianeta in crisi: 7 su 9 limiti vitali g...
Galaxy S25 FE con taglio di prezzo di 10...
4 robot aspirapolvere e 3 scope elettric...
Nuovissimi Xiaomi 15T e 15T Pro con tagl...
Le agenzie federali americane potranno u...
Smartphone pieghevoli sempre più ...
LG svela le Easy TV, una nuova gamma di ...
L'equipaggio della missione Shenzhou-20 ...
Possibili detriti spaziali del razzo cin...
Amazon distrugge i prezzi: TV OLED LG, i...
Trump studia dazi fino al 100% per sping...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 00:59.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v