Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Questo mouse ultraleggero, con soli 36 grammi di peso, è stato concepito per offrire un'esperienza di gioco di alto livello ai professionisti degli FPS, grazie al polling rate a 8.000 Hz e a un sensore ottico da 33.000 DPI. La recensione esplora ogni dettaglio di questo dispositivo di gioco, dalla sua agilità estrema alle specifiche tecniche che lo pongono un passo avanti
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Dal richiamo di Enrico Letta alla necessità di completare il mercato unico entro il 2028 alla visione di Nokia sul ruolo dell’IA e delle reti intelligenti, il Nokia Innovation Day 2025 ha intrecciato geopolitica e tecnologia, mostrando a Vimercate come la ricerca italiana contribuisca alle sfide globali delle telecomunicazioni
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
OPPO Reno14 F 5G si propone come smartphone di fascia media con caratteristiche equilibrate. Il device monta processore Qualcomm Snapdragon 6 Gen 1, display AMOLED da 6,57 pollici a 120Hz, tripla fotocamera posteriore con sensore principale da 50MP e generosa batteria da 6000mAh con ricarica rapida a 45W. Si posiziona come alternativa accessibile nella gamma Reno14, proponendo un design curato e tutto quello che serve per un uso senza troppe preoccupazioni.
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 20-08-2010, 17:56   #1801
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da GT82 Guarda i messaggi
Dispiace che non sia stato colto lo spirito del mio post

sia chiaro che se c'è uno che vorrebbe vedere AMD dominare sui processori blu quello sono io

di 7 pc che ho in casa o da parenti assemblati da me o di cui ho assistito l'acquisto ebbene tutti montano AMD
mi sembra che mi sia stato risposto un po' ingenerosamente
Vedi... non è il discorso se uno è Intellista o meno, è solo che siamo di fronte sempre alla stessa minestra... cioé che se una cosa la fa Intel, è sopravvalutata, se la fa AMD, è sottovalutata.
Scusa, guarda l'aspettativa per gli i7 all'uscita. 50% in più di IPC, 100%, bla bla bla. e sul campo è inferiore a quelle previsioni. Parliamo del Thuban, il 20% in più di IPC al max, che sarebbe arrivato a malapena ad un i920.., TDP 140W per stare a 2,8GHz e poi ci ritroviamo a 95W, che l'OC sarebbe stato impossibile sopra ad un X4 C3, e poi invece?
Ti assicuro che se Buldozer fosse marcato Intel, qua la gente parlerebbe di 50% in più di IPC e clock sui 5GHz almeno e nessuno avrebbe alcun dubbio.
Quote:
certo che non penso che alla AMD siano degli stupidi avendo assistito probabilmente anche un po' divertiti a dove era andata a infilarsi Intel con la Netburst
permetterete però che qualche ansia data dalle indiscrezioni sulla lunghezza delle pipeline di BD sia lecita dato che da 4 anni siamo sotto a Santa Clara come IPC
spiegato completamente dalla faccenda dei compilatori? siamo sicuri?
di solito aumentare gli stadi riduce l'IPC in caso di salti
di solito cercare prestazioni con la frequenza costa parecchio in termini di consumo
felicissimo, anzi direi, estasiato di essere smentito se BD dimostrerà al mondo il contrario
riguardo l'SMT comunque, allo stesso modo nemmeno quelli di Intel penso siano dei deficienti, quindi se l'hanno messo è evidente ed ormai assodato che il rapporto prestazioni/prezzo in termini di consumo addizionale è favorevole
qualunque applicazione che sfrutti il multithreading vede un boost prestazionale con punte di +50% come dimostrato
svantaggi?
Prova a pensare il perché la gente spendeva 1000€ per un i965 EE ed invece per l'i980X sono ben pochi quelli che lo acquistano. Il perché? Semplice, perché l'SMT nel desktop sono più i prb che i vantaggi, cosa che assolutamente non hai con dei core fisici, perché al più, vanno in "parcheggio".
Quote:
probabilmente compensati dal fatto che Nehalem di suo, senza SMT, ha un IPC molto alto
quanto consuma un modulo BD con due core fisici? perchè il vantaggio dell'SMT è proprio lì, impattare molto poco sul consumo.....
Io sarei pronto a scommettere che i proci AMD avranno come cavallo di battaglia proprio il consumo a parità di prestazioni.
Sarò vecchia maniera e "duro", ma io ho sempre dato per scontato che il consumo genera X calore, e non riesco a capacitarmi di come sia possibile che con temp doppie Intel abbia consumi minori.
Comunque, guarda che Intel non alza il clock per problemi di TDP ed il 32nm HKMG avendo un leackage alto non riesce comunque a sfruttarne appieno le potenzialità. Se avesse ottenuto un TDP di 95W a 3,333GHz con l'i980X non credo che si sarebbe fermata lì con il clock (visto che è arrivata a commercializzare proci ad un determinato clock stock che poi si abbassa se si supera il TDP).
Quindi non capisco il perché se AMD riuscirà a commercializzare proci con TDP inferiore (125W sarà il max) e clock superiori, per forza di cose dovrebbero consumare di più di quelli Intel a parità di prestazioni...
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 20-08-2010, 18:23   #1802
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da Ren Guarda i messaggi
Ciao,
Un miglioramento ci sarà sicuramente(algoritmi, tabelle...), ma non penso abbiano allargato il numero di istruzioni fetchabili per clock/thread. (in riferimento alle prestazioni single thread migliorate, quando metà del cluster è inutilizzato)


ps.Il loop detector scatta solo per alcuni tipi di istruzione prevedibili/ricorrenti per spegnere i decoder quando non servono.
Ciao
Guarda, il k10 preleva gia da ora 32byte dalla L1 I, e se consideri che i i7 e compagnia bella ne fetchano solo 16 non mi pare ci sia sto bottleneck. Forse intendi dire che a causa di branch e robette varie, questi 32byte li puòi fetchare ogni 3 cicli di clock. Qui magari un attimino di siviluppo ci dovrebbe essere stato (almeno coso ho capito sul blog di dresdenboy sull'accelerate mode) .
Per il loop detector. beh è una sorta di trace cache alla fine dei conti.

Loop Stream Detector detected small loops in the program code and saved them in a special buffer. As a result, the CPU didn’t have to fetch them from the cache over and over again and predict branching within these loops. Nehalem processors have an even more efficient Loop Stream Detector block, which has been moved past the instructions decoding stage. In other words, Loop Stream Detector now saves decoded loops, which makes it a little similar to Trace Cache of Pentium 4 processors. However, Loop Stream Detector of Nehalem CPUs is a specific cache. First, it is very small, only 28 micro-ops. And second, it saves only loops. Fonte http://www.xbitlabs.com/articles/cpu...e_3.html#sect0
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 20-08-2010, 18:46   #1803
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24169
Quote:
Originariamente inviato da GT82 Guarda i messaggi
Dispiace che non sia stato colto lo spirito del mio post

sia chiaro che se c'è uno che vorrebbe vedere AMD dominare sui processori blu quello sono io

di 7 pc che ho in casa o da parenti assemblati da me o di cui ho assistito l'acquisto ebbene tutti montano AMD
mi sembra che mi sia stato risposto un po' ingenerosamente
Non fraintendermi, non ti ho risposto in quel modo (se ti sono sembrato troppo brusco ti chiedo scusa ) pensando che tu fossi un fanboy, ma per il motivo Netburst...

Quote:
certo che non penso che alla AMD siano degli stupidi avendo assistito probabilmente anche un po' divertiti a dove era andata a infilarsi Intel con la Netburst

permetterete però che qualche ansia data dalle indiscrezioni sulla lunghezza delle pipeline di BD sia lecita dato che da 4 anni siamo sotto a Santa Clara come IPC
spiegato completamente dalla faccenda dei compilatori? siamo sicuri?

di solito aumentare gli stadi riduce l'IPC in caso di salti
di solito cercare prestazioni con la frequenza costa parecchio in termini di consumo

felicissimo, anzi direi, estasiato di essere smentito se BD dimostrerà al mondo il contrario
Si però si cita il discorso a metà tralasciando tutto il resto.
Il P4 a 130nm era una signora CPU, il problema è stato il processo produttivo a 90nm a rendere un fallimento il progetto Netbust.
AMD non ha puntato sulle frequenze perchè all'epoca non riusciva a stare dietro ad Intel, così si è messa all'opera sull'efficienza.
Oggi la situazione è ben diversa, se AMD sta puntando sulle frequenze è perchè dovrebbe (il condizionale è d'obbligo) riuscire ad ottenere un clustered-core con frequenze alte mantenendo bassi i consumi massimi.
Questo non significa ottenere un netbust ma una CPU totalmente diversa dal suo predecessore.
Fermo restando che AMD stessa abbia veramente intenzione di alzare gli stadi per ottenere frequenze molto alte, la verità è che senza conferme ufficiali l'aumento degli stadi potrebbe essere in percentuale molto ridotta...

Quote:
riguardo l'SMT comunque, allo stesso modo nemmeno quelli di Intel penso siano dei deficienti, quindi se l'hanno messo è evidente ed ormai assodato che il rapporto prestazioni/prezzo in termini di consumo addizionale è favorevole
Ma allora perchè l'ATOM fa così schifo con o senza SMT?
Troppo facile glorificare HTT con un architettura come quella del Nehalem...
Quote:
qualunque applicazione che sfrutti il multithreading vede un boost prestazionale con punte di +50% come dimostrato
STM non da un vantaggio del 50% su tutti i programmi, anzi su molti come quelli dei giochi è solo un fastidio...

Quote:
svantaggi? probabilmente compensati dal fatto che Nehalem di suo, senza SMT, ha un IPC molto alto
Uno degli svantaggi del SMT è che in campo server alcuni programmi non digeriscono tale tecnologia a tal punto che lo devi disattivare.
Inoltre se hai (esempio) 2 nehalem X6 in campo server non importa se 12 di quei thread siano solo logici e non fisici, le licenze si pagano per numero di core e dato che ufficialmente sono 24 thread li paghi tutti; e tanti saluti al rapporto prezzo/prestazioni e numero di transistor utilizzati...
Purtroppo il buon ratatost non cè più nel forum () ma se guardi indietro in questo thread abbiamo già analizzato questi difetti...


Quote:
quanto consuma un modulo BD con due core fisici? perchè il vantaggio dell'SMT è proprio lì, impattare molto poco sul consumo.....
E che ne so...
E' ancora troppo presto ma mi sembra che non hai molta fiducia sui 32nm SOI; ti consiglio di leggere gli ultimi post del magnifico bjt2...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 20-08-2010, 18:50   #1804
-El-
Member
 
Iscritto dal: Jul 2009
Messaggi: 93
Quote:
Originariamente inviato da GT82 Guarda i messaggi
...cut...
Scusami se ti ho tagliato il post, ma era troppo lungo da citare, considerando la non scarsa lunghezza del mio.

Amd, quando ha scelto la via dei moduli, ha optato per una via parallela a quella di intel, piu costosa dal punto di vista dell'area ma anche piu efficiente. Una via non nega l'atra, ma implementarle contemporaneamente è probabilmente troppo esoso per le attuali nanometrie.
Potremmo paragonare la scelta di Amd nel campo cpu a quella già fatta nel campo grafico: tanti e piccoli cores che lavorano come un esercito di cinesi. La mentalità Intel è invece simele a quella Nvidia: cores piu grandi e potenti, e SMT è uno dei modi per "pomparli". Questa differenze di prospettive fa sì che nello stesso spazio di un core sb ci stia un modulo Bulldozer, cioè due core.

Riguardo alle frequenze, vorrei ricordare che negli ultimi anni non si ha avuto una crescita di clock neanche paragonabile a quella precedente al periodo NetBurst: è da troppo che siamo fermi alla soglia dei 4 GHz senza riuscire a superarli. Credo che i tempi siano ormai maturi per una nuova crescita in tale ambito.

Riguardo l'Ipc per core, a parità di clock sarà sicuramente superiore, ma non mi aspetto una rivoluzione in tale ambito: senza dubbio grandi vantaggi verranno dall'uso di una cache a 8T, molto più veloce e vero punto di forza di Intel sino ad ora; e il punto di debolezza saranno dati dal raro caso in cui l'uso di istruzioni Avx mandi installo l'altro core del modulo che necessita l'uso della Fpu.

Ultima modifica di -El- : 20-08-2010 alle 18:53.
-El- è offline  
Old 20-08-2010, 20:29   #1805
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Ciao
Guarda, il k10 preleva gia da ora 32byte dalla L1 I, e se consideri che i i7 e compagnia bella ne fetchano solo 16 non mi pare ci sia sto bottleneck. Forse intendi dire che a causa di branch e robette varie, questi 32byte li puòi fetchare ogni 3 cicli di clock. Qui magari un attimino di siviluppo ci dovrebbe essere stato (almeno coso ho capito sul blog di dresdenboy sull'accelerate mode) .
Per il loop detector. beh è una sorta di trace cache alla fine dei conti.
Volevo dire che il branch condiviso non crea grandi aumenti prestazionali quando un core è inutilizzato, perchè credo abbiano mantenuto la stessa ampiezza, ma implementando il doppio thread. (semplificando il concetto)

I soli stadi che mi vengono in mente che potrebbero aumentare le performance mono-thread del cluster sono i decoder ed il dispatch(se tutte le sue porte sono connesse ad ogni core).

Ultima modifica di Ren : 20-08-2010 alle 20:37.
Ren è offline  
Old 20-08-2010, 21:08   #1806
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Uno degli svantaggi del SMT è che in campo server alcuni programmi non digeriscono tale tecnologia a tal punto che lo devi disattivare.
Inoltre se hai (esempio) 2 nehalem X6 in campo server non importa se 12 di quei thread siano solo logici e non fisici, le licenze si pagano per numero di core e dato che ufficialmente sono 24 thread li paghi tutti; e tanti saluti al rapporto prezzo/prestazioni e numero di transistor utilizzati...
Purtroppo il buon ratatost non cè più nel forum () ma se guardi indietro in questo thread abbiamo già analizzato questi difetti...
SMT è un fastidio quando il programma non scala bene i core, quindi non è un problema imputabile al hardware, ma solo al software che pecca nel multi-core. (un controsenso in una macchina server)

Quote:
Ma allora perchè l'ATOM fa così schifo con o senza SMT?
Troppo facile glorificare HTT con un architettura come quella del Nehalem...
Ho già risposto prima, ma ripetere non mi disturba.

Atom nasce sulla base del pentium 1, quindi esegue le istruzioni direttamente, senza un meccanismo che massimizza il parallelismo del codice, inoltre possiede meno alu degli altri competitor.

SMT un aumento lo porta anche nel atom ed eccoti alcuni esempi che già conosci :




bye

Ultima modifica di Ren : 20-08-2010 alle 21:14.
Ren è offline  
Old 20-08-2010, 21:15   #1807
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24169
Quote:
Originariamente inviato da Ren Guarda i messaggi
SMT è un fastidio quando il programma non scala bene i core, quindi non è un problema imputabile al hardware, ma solo al software che pecca nel multi-core. (un controsenso in una macchina server)
Eppure esistono casi dove consigliano espressamente di disattivare SMT; ecco alcuni esempi:
Clicca qui e clicca qui...


Quote:
Ho già risposto prima, ma ripetere non mi disturba.

Atom nasce sulla base del pentium 1, quindi esegue le istruzioni direttamente, senza un meccanismo che massimizza il parallelismo del codice, inoltre possiede meno alu degli altri competitor.

SMT un aumento lo porta anche nel atom ed eccoti alcuni esempi che già conosci :


Ma infatti non metto in dubbio la validità del SMT su una architettura come il Nehalem, le cose cambiano quando essa non è affatto performante, vedi appunto Atom e il P4...
SMT non è la soluzione definitiva e infatti AMD ha preferito seguire strade diverse...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 20-08-2010, 21:53   #1808
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Ma infatti non metto in dubbio la validità del SMT su una architettura come il Nehalem, le cose cambiano quando essa non è affatto performante, vedi appunto Atom e il P4...
SMT non è la soluzione definitiva e infatti AMD ha preferito seguire strade diverse...
Il punto è che rimane una valida opzione(usatissima) per aumentare le performance su qualunque architettura moderna esistente. Le GPU sono l'esempio lampante della sua efficacia per mascherare latenze su porzioni di codice altamente parallelo.

AMD ha percorso una strada rischiosa totalmente nuova, considerando che Sun prima di lei ha abbandonato un progetto simile(rock).
Vedremo solo tra diversi mesi se ne nascerà una bestia perfromance/mm2...
Ren è offline  
Old 20-08-2010, 21:55   #1809
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Per quanto riguarda le pipeline supposte di bulldozer.
Il clock dipende da quanto uno stadio della pipeline è piccolo (a parità di processo produttivo). Più è piccolo, più stadi ci vogliono. Per misurare quanto uno stadio di una pipeline è lento (ma più è lento, più "potente" è, più cose può fare e meno stadi ci vogliono) c'è una unità di misura: il ritardo in termini di FO (mi pare sia Fan-Out, ma io conosco un altro significato per questo termine). Uno stadio di pipeline con FO n, vuol dire che è composto da n porte logiche in cascata, ossia che un segnale in ingresso allo stadio deve percorrere al più n porte logiche prima di giungere all'uscita. Il tempo di propagazione di una porta logica si misura in picosecondi. Così uno stadio con FO n avrà un ritardo di propagazione di poche centinaia di picosecondi.
Più è alto il FO, più è complicata l'operazione che può fare uno stadio, potenzialmente ci vogliono meno stadi, ma il clock è dato dallo stadio più lento, per cui il clock è più basso.

Le CPU della serie K7-8-10 fino ad adesso sono state accreditate di stadi con FO 24 (circa: non si conosce il valore esatto, ma lo si stima dal clock riferito al processo produttivo), che è un valore molto alto: clock non molto alto, ma ogni stadio ha sufficente potenza elaborativa da permettere pochi stadi (12 la pipeline intera del K10, mi pare).

Le CPU della serie Core 2/Nehalem sono accreditate di qualche FO in meno (21-22), per cui possono avere un clock più elevato a parità di processo produttivo (infatti il clock è limitato principalmente dal TDP, ossia dal leakage: se correttamente raffreddate le CPU INTEL sfiorano i 5GHz) anche se comunque i transistors INTEL sono un po' più veloci di quelli AMD, quindi avrebbero avuto un clock massimo superiore anche con lo stesso FO (ma maggiore leakage perchè manca il SOI)...
FO minore richiede qualche stadio in più e infatti mi pare sia così (se non lo è, un plauso va agli ingegneri INTEL oppure le unità RISC sono più semplici)

Poi viene l'architettura POWER, accreditata di 16-18 FO. E infatti arriva a 4.14 GHz stock con il processo a 45nm SOI...

Poi viente il Pentium 4. E' accreditato di un FO di 16 per le parti non dual pumped e di un FO 8 per l'ALU dual pumped.

Come si vede è possibile fare una architettura efficiente anche con un FO vicino al P4 (vedi la CPU Power) e comunque Buldozer potrebbe avere un FO leggermente inferiore al K10 (ma probabilmente si dovrebbero fare tutte le librerie daccapo), senza per questo rischiare di essere il nuovo Pentium 4.


Questo per dire che c'è margine per fare pipeline più lunghe senza per questo fare un nuovo P4...
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 20-08-2010, 22:00   #1810
calabar
Senior Member
 
L'Avatar di calabar
 
Iscritto dal: Oct 2001
Messaggi: 14736
Sono un po' OT, ma che io ricordi, SMT risulta molto incisivo nell'Atom proprio perchè questo è un processore in order, e quindi la possibilità di avere subito a disposizione un altro thread permette un ottimo guadagno prestazionale.
Ho idea che proprio con Atom SMT dia un contributo proporzionalmente maggiore rispetto ad architetture più efficienti.

Tornando a BD, bisogna vedere anche se le due filosofie sono compatibili, o per lo meno se lo sono e danno risultati utili.

A questo punto tiro fuori una domanda da niubbone primo della classe, perchè c'è un punto che non mi è molto chiaro e vorrei capire meglio.

Si parla del core int del K10 che ha 3 pipeline, mentre quella intel (core due e immagino anche nehalem) e quella di bulldozer dovrebbero averne 4, tanto che si ottiene un ipc maggiore.
Dal momento quindi che anche un singolo core è composto da sottounità, non sarebbe possibile anche per i core int all'interno di un modulo bulldozer unire le pipeline di ognuno per ottenere un super-core con 8 pipeline int e con ipc più elevato, così da colmare il gap a livello di singolo core?
Insomma... forse quello che la gente si aspettava da un "reverse hypertreading" hardware.
calabar è offline  
Old 20-08-2010, 22:05   #1811
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Si parla del core int del K10 che ha 3 pipeline, mentre quella intel (core due e immagino anche nehalem) e quella di bulldozer dovrebbero averne 4, tanto che si ottiene un ipc maggiore.
Dal momento quindi che anche un singolo core è composto da sottounità, non sarebbe possibile anche per i core int all'interno di un modulo bulldozer unire le pipeline di ognuno per ottenere un super-core con 8 pipeline int e con ipc più elevato, così da colmare il gap a livello di singolo core?
Insomma... forse quello che la gente si aspettava da un "reverse hypertreading" hardware.
No, perchè la logica che riordina il codice (estrae il parallelismo) di un singolo thread, perde efficienza (in media) già dalla terza ALU da servire, quindi si avrebbe un aumento relativo delle performance, ma con un aumento altissimo della complessità. (in breve, non conviene...)

Ultima modifica di Ren : 20-08-2010 alle 22:22.
Ren è offline  
Old 20-08-2010, 23:04   #1812
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Io sono in overflow da tempo con tutti sti dati...

Però quello che non riesco a capire... (il nubbione 1° della classe sono io, Calabar )... Non sarebbe stato più semplice rimanere nell'architettura K10 raddoppiando i registri esistenti ed al limite aggiungerne altri, adeguando comunque il tutto a monte per far si che il tutto funzionasse a più istruzioni elaborate per clock? (chiaramente con tutte le istruzioni nuove...).

Cioè... non sono certo un tecnico di proci all'interno, ma vedere lo schema di un K10 e quello di un Buldozer... c'è da prendere paura... raddoppia quasi ovunque.

Però... non ricordo che AMD abbia fatto un flop architetturalmente su un procio... il Phenom I, la colpa era del 65nm perché sul 45nm se avesse avuto il low-k o l'HKMG o ambedue da subito... la cosa sarebbe stata diversa.

Ma anche l'atmosfera che c'è è molto diversa... alla presentazione del Phenom I praticamente hanno mandato i portaborse... ora praticamente si danno quasi i cazzotti a se stessi perché non possono parlare...
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 21-08-2010, 00:31   #1813
affiu
Senior Member
 
L'Avatar di affiu
 
Iscritto dal: Jan 2010
Messaggi: 2858
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Io sono in overflow da tempo con tutti sti dati...

Però quello che non riesco a capire... (il nubbione 1° della classe sono io, Calabar )... Non sarebbe stato più semplice rimanere nell'architettura K10 raddoppiando i registri esistenti ed al limite aggiungerne altri, adeguando comunque il tutto a monte per far si che il tutto funzionasse a più istruzioni elaborate per clock? (chiaramente con tutte le istruzioni nuove...).

Cioè... non sono certo un tecnico di proci all'interno, ma vedere lo schema di un K10 e quello di un Buldozer... c'è da prendere paura... raddoppia quasi ovunque.

Però... non ricordo che AMD abbia fatto un flop architetturalmente su un procio... il Phenom I, la colpa era del 65nm perché sul 45nm se avesse avuto il low-k o l'HKMG o ambedue da subito... la cosa sarebbe stata diversa.

Ma anche l'atmosfera che c'è è molto diversa... alla presentazione del Phenom I praticamente hanno mandato i portaborse... ora praticamente si danno quasi i cazzotti a se stessi perché non possono parlare...
premesso che orapiu manca poco alla conferenza..e dopo di che verrano valanghe di opinioni,commenti,critiche ecc

secondo me ,l'archiettura bulldozer non è completa al 100 %, perche da un lato è una architettura nuova(è dunque sarà soggetta di miglioramenti) sia perchè è una strada intrapresa per avere piu potenza

dopotutto non si vive di sola frequenza ma anche di altro(?) ,di qualcosa di nuovo di diverso

poi per il mio immaginario sarei molto curioso di vedere come vanno i giochi , bulldozer vs apu

bulldozer fara fare piu frame rispetto a apu , ma secondo me apu cmq anche se lo fa girare con risoluzioni un po minori di bulldozer

è tutto su un unico pezzo hardaware invece che di un processore e scheda video a parte

meno watt, meno calore ,meno corrente ...tutto il resto deve solo avverarsi a questo punto

cioe voglio vedere se si potra constatare la differenza fra un k10 vs bulldozer,pero il k10 ha una apu.....è questo il punto?

perchè se apu farà girare i giochi in maniera ''naturale'' ,allora la strada ''è'' quella giusta ,secondo me

poi per quanto si possa filosofare sulla fantasia, il muro di frequenze odierne su cui bramiamo sempre di piu ,addirittura sempre invadere (forse) le future gpu integrate.....

il tutto genera confusione ,allarme ,ma questo tutto è solamente una grande massa di nebbia ,da cui si potra scorgere bulldozer che esce da pozzo magico ....ma verrà seguito da apu

è soltanto la frammentazione di un progetto molto piu grande ,il fatto di vedere molte novita messe assieme(per il momento daranno i loro frutti da separati)

ma presto queste novita convergeranno ,perchè in futuro ci sarà bisogno di elaborare flussi di dati molto elevati (ad esempio un sata 12)...e onestamente mi scoccerebbe ritrovarmi con un 24 0 36 core da raffreddare con l'elio liquido

aspettiamo....
affiu è offline  
Old 21-08-2010, 09:58   #1814
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da Ren Guarda i messaggi
Volevo dire che il branch condiviso non crea grandi aumenti prestazionali quando un core è inutilizzato, perchè credo abbiano mantenuto la stessa ampiezza, ma implementando il doppio thread. (semplificando il concetto)

I soli stadi che mi vengono in mente che potrebbero aumentare le performance mono-thread del cluster sono i decoder ed il dispatch(se tutte le sue porte sono connesse ad ogni core).
Ciao
Scusami, non avevo inteso bene il concetto.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 21-08-2010, 11:02   #1815
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Però quello che non riesco a capire... (il nubbione 1° della classe sono io, Calabar )... Non sarebbe stato più semplice rimanere nell'architettura K10 raddoppiando i registri esistenti ed al limite aggiungerne altri, adeguando comunque il tutto a monte per far si che il tutto funzionasse a più istruzioni elaborate per clock? (chiaramente con tutte le istruzioni nuove...).
Se parli di raddoppiare registri (sotto, sotto) stai proponendo SMT anche per AMD...

Quote:
Cioè... non sono certo un tecnico di proci all'interno, ma vedere lo schema di un K10 e quello di un Buldozer... c'è da prendere paura... raddoppia quasi ovunque.
Raddoppia tutto, ma in realtà sono due core (fusi) in uno, grazie ad alcuni elementi in comune.

Ultima modifica di Ren : 21-08-2010 alle 11:11.
Ren è offline  
Old 21-08-2010, 11:11   #1816
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24169
Tenete duro, il 24 agosto al Hot chip 22 sapremo () le caratteristiche di Bulldozer...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright

Ultima modifica di capitan_crasy : 21-08-2010 alle 12:01.
capitan_crasy è offline  
Old 21-08-2010, 11:30   #1817
dark.halo
Senior Member
 
L'Avatar di dark.halo
 
Iscritto dal: Jan 2010
Città: Torino
Messaggi: 485
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
Tenete duro, domani comincia Hot chip 22 e finalmente sapremo () le caratteristiche di Bulldozer...
vuoi dire che già da domani si comincerà a sapere qualcosa, non era il 24

EDIT:ho visto adesso sul sito e si il 24 si parla di bulldozer e bobcat (alle 5.45 e 6.30 ora locale), ci sarà anche intel con westmere-ex 10 core/20 thread

Ultima modifica di dark.halo : 21-08-2010 alle 11:40.
dark.halo è offline  
Old 21-08-2010, 12:01   #1818
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24169
Quote:
Originariamente inviato da dark.halo Guarda i messaggi
vuoi dire che già da domani si comincerà a sapere qualcosa, non era il 24

EDIT:ho visto adesso sul sito e si il 24 si parla di bulldozer e bobcat (alle 5.45 e 6.30 ora locale), ci sarà anche intel con westmere-ex 10 core/20 thread
Hai ragione...
Corretto il post precedente...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 21-08-2010, 14:05   #1819
navarre63
Bannato
 
Iscritto dal: Jun 2006
Messaggi: 1797
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Per quanto riguarda le pipeline supposte di bulldozer.
Il clock dipende da quanto uno stadio della pipeline è piccolo (a parità di processo produttivo). Più è piccolo, più stadi ci vogliono. Per misurare quanto uno stadio di una pipeline è lento (ma più è lento, più "potente" è, più cose può fare e meno stadi ci vogliono) c'è una unità di misura: il ritardo in termini di FO (mi pare sia Fan-Out, ma io conosco un altro significato per questo termine). Uno stadio di pipeline con FO n, vuol dire che è composto da n porte logiche in cascata, ossia che un segnale in ingresso allo stadio deve percorrere al più n porte logiche prima di giungere all'uscita. Il tempo di propagazione di una porta logica si misura in picosecondi. Così uno stadio con FO n avrà un ritardo di propagazione di poche centinaia di picosecondi.
Più è alto il FO, più è complicata l'operazione che può fare uno stadio, potenzialmente ci vogliono meno stadi, ma il clock è dato dallo stadio più lento, per cui il clock è più basso.

Le CPU della serie K7-8-10 fino ad adesso sono state accreditate di stadi con FO 24 (circa: non si conosce il valore esatto, ma lo si stima dal clock riferito al processo produttivo), che è un valore molto alto: clock non molto alto, ma ogni stadio ha sufficente potenza elaborativa da permettere pochi stadi (12 la pipeline intera del K10, mi pare).

Le CPU della serie Core 2/Nehalem sono accreditate di qualche FO in meno (21-22), per cui possono avere un clock più elevato a parità di processo produttivo (infatti il clock è limitato principalmente dal TDP, ossia dal leakage: se correttamente raffreddate le CPU INTEL sfiorano i 5GHz) anche se comunque i transistors INTEL sono un po' più veloci di quelli AMD, quindi avrebbero avuto un clock massimo superiore anche con lo stesso FO (ma maggiore leakage perchè manca il SOI)...
FO minore richiede qualche stadio in più e infatti mi pare sia così (se non lo è, un plauso va agli ingegneri INTEL oppure le unità RISC sono più semplici)

Poi viene l'architettura POWER, accreditata di 16-18 FO. E infatti arriva a 4.14 GHz stock con il processo a 45nm SOI...

Poi viente il Pentium 4. E' accreditato di un FO di 16 per le parti non dual pumped e di un FO 8 per l'ALU dual pumped.

Come si vede è possibile fare una architettura efficiente anche con un FO vicino al P4 (vedi la CPU Power) e comunque Buldozer potrebbe avere un FO leggermente inferiore al K10 (ma probabilmente si dovrebbero fare tutte le librerie daccapo), senza per questo rischiare di essere il nuovo Pentium 4.


Questo per dire che c'è margine per fare pipeline più lunghe senza per questo fare un nuovo P4...
ma che aspetta la NASA a chiamarti?
navarre63 è offline  
Old 21-08-2010, 15:27   #1820
Korn
Senior Member
 
L'Avatar di Korn
 
Iscritto dal: Jul 2000
Città: La città più brutta della Toscana: Prato
Messaggi: 6711
a quelli gli basta un 8088
Korn è offline  
 Discussione Chiusa


Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza Sottile, leggero e dall'autonomia WOW: OPPO Reno...
Destiny Rising: quando un gioco mobile supera il gioco originale Destiny Rising: quando un gioco mobile supera il...
Plaud Note Pro convince per qualità e integrazione, ma l’abbonamento resta un ostacolo Plaud Note Pro convince per qualità e int...
Tamron 25-200mm F/2.8-5.6 Di III VXD G2:...
Il rover NASA VIPER arriverà sull...
Il MagSafe Battery Pack ha la stessa bat...
Il tri-fold di Samsung sta arrivando e s...
Prezzi a picco su Amazon nel weekend: 25...
6 accessori Amazon per pulire in maniera...
Tesla riprogetterà le sue iconich...
iPhone 17 Pro e Pro Max, eccoli tutti su...
Amazon abbatte il prezzo: scopa elettric...
Super sconti Amazon: 5 ottimi smartphone...
iPhone Air non è solo sottile: &e...
Energia in Italia ad agosto: consumi in ...
SpaceX guarda ai primi voli orbitali del...
Il prototipo del razzo spaziale riutiliz...
Blue Origin mostra uno spettacolare vide...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 01:05.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v