Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB
Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB
Inizia l’era dell’AI storage. Durante l’Innovative Data Infrastructure Forum 2024, Huawei ha presentato OceanStor A800, una soluzione innovativa pensata per i carichi di lavoro legati all’intelligenza artificiale generativa
Recensione Google Pixel Tablet: in ritardo ma un ottimo primo passo!
Recensione Google Pixel Tablet: in ritardo ma un ottimo primo passo!
Il Pixel Tablet di Google arriva finalmente anche in Italia e lo fa quasi un anno dopo il suo debutto negli USA e in alcuni paesi nel mondo. Un ritardo che sembra però aver giovato al device che arriva performante e con molte funzionalità uniche che possono renderlo decisamente appetibile.
ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED i per professionisti dell'immagine
ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED i per professionisti dell'immagine
Un monitor veramente completo, per funzionalità e prestazioni. La presenza di un colorimetro integrato consente di agevolare le operazioni di calibrazione, anche per il mantenimento periodico delle prestazioni
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 06-10-2017, 17:31   #1
CrapaDiLegno
Senior Member
 
Iscritto dal: Jan 2011
Messaggi: 3287
Analisi: CPU e parallelismo, scaling

Non so se il luogo giusto per questo tipo di post... ma ci provo comunque.

Dopo la recensione delle ultime CPU Intel della serie 8 ho fatto un paio di conti per vedere come le CPU con tanti core (la moda del momento) si comportano rispetto a quelle con meno core.
L'intenzione non è quella di misurare le semplici prestazioni assolute che già i test danno, ma di vedere come le CPU si comportano in maniera diversa a seconda del numero di core, della presenza o meno del'HT e come scalano in frequenza.
Ho preso in esame sia le CPU Intel che quelle AMD le cui prestazioni sono misurate nella recensione.

Non è uno studio al nanosecondo e con 10 cifre decimali.
Lo studio parte da una semplice tabella con i numeri delle prove fatte dalla recensione con i quali è stato calcolato un indice "di lavoro per core per ciclo" (che ho chiamato WCC, Work per Core per Cycle), ovvero un valore che definisce quanto lavoro ha svolto mediamente un singolo core per ogni ciclo per raggiungere alle prestazioni finali. E' un indice che normalizza le prestazioni per il numero di core e per la frequenza (nominale) usata. In prativa indica quanto è stato efficiente un core ad eseguire un determinato lavoro.
Da quell'indice poi sono stati ricavati una serie di altri confronti per vedere come questo indice scala con la presenza o meno dell'HT (Hyper Treading), per numero di core presenti nella CPU e anche per frequenza.
Tutti i valori sono calcolati usando la frequenza turbo nominale minima del processore, visto che in teoria con tutti i core attivi (come nelle prove del caso) non dovrebbe essere applicato alcun boost. Anche se poi si vede che non è vero.

Non è uno studio per alimentare guerre di religione. Sono semplici numeri che devono essere presi per quel che valgono con i test forniti. Non c'è confronto sui consumi.
Sarebbe stato bello che l'analisi a tavolino dei risultati l'avesse fatta qualche recensore che ha più a disposizione (ed è pagato per farle... di C&P di prove fatte da altri ormai ne è pieno il Web).
Non tirare le fila di una recensione oltre che mostrare degli sterili numeri con le barrette colorate, a parer mio, è fare metà del lavoro.

Si parte con la tabella delle prestazioni calcolate con il calcolo dell'indice WCC che si calcola semplicemente così:
se la prestazione è un valore di lavoro svolto (più grande più lavoro) si divide questo numero per il numero di core moltiplicato per la frequenza.
se la prestazione è un tempo (più piccolo migliore prestazione, come quello riportato per Blender) si fa il reciproco del numero che moltiplica la prestazione per il numero di core per la frequenza.
I valori così ottenuti sono poi scalati di una costante grande a sufficienza per avere numeri dove non serve la virgola.
Ovviamente l'indica può essere confrontato solo con i valori calcolati dello stesso test.

L'indice WCC è quindi un valore assoluto che per ogni singolo test permette di comparare le prestazioni per core anche di architetture diverse.
I numeri qui dicono che AMD è ancora un po' indietro rispetto a Intel per quanto riguarda l'efficienza per singolo core, sopratutto con ThreadRipper.
Ecco perché per esempio nel test Povray il 16 core Intel a 2.8GHz va circa il 10% in più rispetto al 16 core AMD a 3.5GHz realizzando un WCC che è il 36% migliore.
Con la versione "consumer" invece il gap è minore, fino ad annullarsi nei test Cinebench e Handbrake.
Un paio di confronti del WCC per processori con caratteristiche simili per numero di core e HT attivato



Qui un confronto tra la stessa architettura quando l'HT è abilitato o meno.
Come si vede lo scaling ideale sarebbe il raddoppio delle prestazioni, ma in realtà siamo molto ma molto lontani da quel valore, sia per Intel che per AMD.
Se si vuole fare le pulci ai numeri calcolati si vede che l'HT di AMD funziona leggermente meglio di quello Intel, almeno sull'unico confronto che si può fare con AMD che ha solo un processore con 4 core senza HT abilitato (tutti gli altri ce l'hanno sempre abilitato).
Il confronto tra il 1300X e il 1400 e poi 1500X mette in evidenza come la versione X boosti un po' di più.



Qui un confronto con numero di core diversi. Notare che i valori sono più o meno gli stessi tra Intel e AMD.
Il confronto tra le due differenti architetture di Intel (quella per i processori fino a 4 core e quella con più di 12) mostra come quest'ultima sia in effetti più prestante in certe situazioni.
Si vede anche che per tutti i confronti il test Hybrid non scala proprio bene con il numero dei core come invece fanno meglio gli altri.



Qui un piccolo confronto tra CPU con stessa architettura interna ma impostate con frequenze diverse. Il test non è precisissimo entrando un gioco il boost che Intel e AMD danno ai core sotto particolari carichi e secondo la fascia in cui il processore è venduto.
Notare come scala stranamente il nuovo 8600K rispetto al più economico 8400.



Con questi numeri. Si possono fare altre considerazioni che lascio a voi analizzare.
Spero di aver dato qualche elemento in più di conoscenza che male non fa in un forum tecnico.

P.S: i fanboy di entrambi gli schieramenti sono pregati di non appellarsi alle virgole mancanti per cercare di avere ragione o costruire argomentazioni fittizie.

Ultima modifica di CrapaDiLegno : 06-10-2017 alle 17:40.
CrapaDiLegno è offline   Rispondi citando il messaggio o parte di esso
Old 06-10-2017, 17:33   #2
CrapaDiLegno
Senior Member
 
Iscritto dal: Jan 2011
Messaggi: 3287
E' possibile fare in modo che appaia la preview di una immagine direttamente nel post invece che il solo link?
CrapaDiLegno è offline   Rispondi citando il messaggio o parte di esso
Old 06-10-2017, 20:06   #3
Vul
Senior Member
 
Iscritto dal: Nov 2006
Messaggi: 6702
Faccio fatica a comprendere questi interessanti grafici.

Comunque paragonare le cpu per clock ha senso solo ed esclusivamente se sono della stessa famiglia.

Architetture differenti eseguono le istruzioni differentemente, ci sono troppe variabili: qualità codice compiler e qualità codice iniziale su tutti.
Vul è offline   Rispondi citando il messaggio o parte di esso
Old 06-10-2017, 20:32   #4
CrapaDiLegno
Senior Member
 
Iscritto dal: Jan 2011
Messaggi: 3287
Sì, comprendo che le tabelle non sono molto curate nella loro comprensione immediata.
Ho fatto una cosa per me e ho voluto condividerla con voi.
Se hai capito cosa è l'indice WCC però dovrebbe poi essere tutto chiaro, perché viene sempre fatto il confronto di quello.

Il confronto per frequenza è fatto usando la stessa identica architettura e numero di core:
se guardi l'ultima tabella ho confrontato l'8600K con l'8400 che hanno entrambi 6 core no HT, il 7600K con la versione non K e le fasce adiacenti di AMD (anche per cercare di capire se le versioni X hanno davvero questo boost o no).
L'unico confronto tra architetture diverse l'ho fatto tra il 7700K e il 6700K per vedere se al netto dell'aumento di frequenza c'era qualcosa di diverso che portava la serie 7 ad essere più veloce della 6: il risultato è che la serie 7 è tra il 4 e il 6% più veloce della serie 6 a pari frequenza che è in linea con quello che sia Intel che AMD ottengono come guadagno usando boost leggermente più spinti. Nulla de che, quindi.

In particolare, nella tabella hai il confronto tra due CPU con il valore in percentuale che ti dice quanto la CPU sopra è più veloce di quella sulla linea sotto.
Sulla terza linea di ogni confronto hai i risultati dei confronti. A partire da sinistra hai il rapporto tra i clock, quindi in teoria delle prestazioni se lo scaling fosse perfettamente lineare.
Poi seguono per ogni test due confronti, ovvero quello delle prestazioni reali il cui numero come detto dovrebbe essere uguale al primo calcolato (in un mondo ideale) e il secondo ti dice quanto è lo scarto in percentuale rispetto a quel 100% che vorrebbe dire scaling lineare perfetto.
Che è lo stesso identico scarto che hai tra gli indici WCC, che serve proprio per semplificare i confronti senza dover sapere esattamente il valore delle prestazioni assolute.

Spero di essere stato più chiaro.
CrapaDiLegno è offline   Rispondi citando il messaggio o parte di esso
Old 07-10-2017, 14:05   #5
evil weasel
Senior Member
 
L'Avatar di evil weasel
 
Iscritto dal: Oct 2009
Messaggi: 746
Interassante comparativa, però non viene considerato come praticamente tutte le CPU hanno un turbo all-core anche molto aggressivo.
Ormai la frequenza base lascia molto il tempo che trova, soprattutto in test sintetici di breve durata.
evil weasel è offline   Rispondi citando il messaggio o parte di esso
Old 07-10-2017, 14:45   #6
Gioz
Senior Member
 
Iscritto dal: Feb 2005
Messaggi: 4972
il clock base è applicato pressoché esclusivamente con l'utilizzo di istruzioni avx, fuori da quei casi sia gli intel che amd tendono ad applicare il turbo all core.
gli amd lo fanno con la massima frequenza xfr fino ad un massimo di 2 core/4 thread sull'AM4 e 4core/8thread per Threadripper con il turbo all core su tutti, gli intel a seconda del modello applicano una frequenza diversa in relazione al numero di core (per fare un esempio 7900X opera a 4.3GHz fino a 2 core, 4.1GHz da 3 fino a 4 core e 4GHz da 5 a 10 core in load, le versioni maggiori a loro volta applicano frequenze diverse).
Gioz è offline   Rispondi citando il messaggio o parte di esso
Old 08-10-2017, 18:33   #7
CrapaDiLegno
Senior Member
 
Iscritto dal: Jan 2011
Messaggi: 3287
Come ho specificato, il turbo core non è stato preso in considerazione perché dipende da un sacco di fattori (in primis la temperatura dio esercizio) e poi perché teoricamente, avendo tutti i core in carico (questi test mettono tutti i core al massimo carico) non ci dovrebbe essere alcun margine termico disponibile per applicarlo e se lo applicano non di certo per tutto il periodo del test (altrimenti che ci sta a fare il TPD?).

Come si vede sulle CPU AMD che distingue tra CPU con boost esteso (le versioni X) e quelle no la differenza di questo boost è praticamente ininfluente in questi test. Vedere il WCC tra 1700X e 1700 dove quest'ultimo si comporta pure meglio. Per Intel non so, visto che l'applicazione del suo turbo è un po' più misteriosa (almeno per me) ma se vale il valore di TDP, come già detto con tutti i core in carico, di turbo non ce ne dovrebbe essere se non per pochi secondi.

Comunque sia, il risultato è poi quello. Per cui quando cercate una CPU con tanti core c'è da chiedersi alla fine quanto lavoro reale riesce a svolgere più che quanti core ha.
Per esempio vedere come si comportano i ThreadRipper con il test Hybrid. Lì tanti core non premiano assolutamente.
L'idea era mostrare che non sempre tanti core è meglio: non sempre e non tutti i lavori sono parallelizzabili senza incorrere in penalità che degradano le prestazioni per singolo core man mano che sempre più thread vengono aggiunti così come descritto dalla legge di Amdahl, che molti ignorano parlando sempre di ottimizzazioni fatte bene solo quando i programmi sfruttano n-mila core.. mica vero.
CrapaDiLegno è offline   Rispondi citando il messaggio o parte di esso
Old 08-10-2017, 20:43   #8
Gioz
Senior Member
 
Iscritto dal: Feb 2005
Messaggi: 4972
Quote:
Originariamente inviato da CrapaDiLegno Guarda i messaggi
Come ho specificato, il turbo core non è stato preso in considerazione perché dipende da un sacco di fattori (in primis la temperatura dio esercizio) e poi perché teoricamente, avendo tutti i core in carico (questi test mettono tutti i core al massimo carico) non ci dovrebbe essere alcun margine termico disponibile per applicarlo e se lo applicano non di certo per tutto il periodo del test (altrimenti che ci sta a fare il TPD?).
in base ai set di istruzioni eseguiti vengono attivati in modo diverso le varie parti logiche del processore, di conseguenza varia la potenza necessaria...ed è la ragione per cui a seconda del tipo di carico c'è effettivamente margine termico disponibile per applicare il turbo.
se tu prendi a riferimento cinebench in cui sia intel che amd riescono ad applicare il massimo turbo all core, ma poi rapporti il punteggio alla frequenza base ottieni un indice falsato, se prendessi vray dove ad esempio con gli amd il turbo con glisi attiva in maniera altalenante allora otterresti un indice falsato sia considerando la frequenza base che quella turbo all-core.
in particolare intel calcola il TDP sulle avx al clock base.

l'idea che proponi è molto interessante, ma se non conosci l'effettivo clock allora derivi un indice che non è rappresentativo quanto vorresti.

esempio, qui vedi come in vray abbia un moltiplicatore "medio" di 30.5 con il 1700 settato a default (30x base, 32x turbo all core):
Gioz è offline   Rispondi citando il messaggio o parte di esso
Old 08-10-2017, 20:59   #9
Gioz
Senior Member
 
Iscritto dal: Feb 2005
Messaggi: 4972
aggiungo per completezza screen di cinebench

default moltiplicatore e alimentazione automatica (come si può notare dal fatto che 1 core è stato monitorato fino a moltiplicatore 37,5x)


e forzando manualmente moltiplicatore 32x


i punteggi sono pressochè identici a dimostrazione del fatto che a default, su cinebench, il turbo all core è applicato costantemente diversamente ad esempio da vray di cui sopra.
con bios precedenti, in auto, mi è capitato di ottenere punteggi diversi rispetto al moltiplicatore fisso pur non rilevando variazioni con software di monitoring, ma coi bios precedenti oggettivamente c'era qualche problema di varia natura: lo specifico perché era già emersa la questione.

P.S. se gli screen sono troppo grandi edito e lascio il link anziché visualizzarli
Gioz è offline   Rispondi citando il messaggio o parte di esso
Old 09-10-2017, 09:36   #10
Gioz
Senior Member
 
Iscritto dal: Feb 2005
Messaggi: 4972
altro esempio, il mostruoso i9 7980XE da 18 core arriva ad applicare
4.2GHz su 1 o 2 core, 4GHz su 2 e 4 core, 3.9GHz da 5 a 12 core, 3.5GHz da 13 a 16, e 3.4GHz se sono in load 17 o tutti e 18 i core.
dalla recensione di kit guru, cpu settata stock:


si vede come effettivamente in cinebench tutti i core siano a 3400MHz, se tu quindi prendi il punteggio e lo rapporti al clock base di 2.6 ottieni un valore che non è affidabile.
dalla tua tabella 3324punti diviso (18x2,6) = 71,02 => 71
contro 3334punti diviso (18x3,4) = 54,47 => 54

3334 e 3324 fanno comprendere che in entrambe le recensioni, il processore, girava alla medesima frequenza dato che anche tra un'esecuzione e l'altra c'è sempre un po' di margine di tolleranza.

chiaramente se un processore ha un all core turbo di +100MHz sul clock base, la differenza è molto ridotta e l'indice è comunque rappresentativo;
se un processore ha un turbo all core di +700/1000MHz l'indice è molto meno rappresentativo.

spero che questi esempi possano esserti utili per valutare la situazione.
Gioz è offline   Rispondi citando il messaggio o parte di esso
Old 09-10-2017, 12:05   #11
CrapaDiLegno
Senior Member
 
Iscritto dal: Jan 2011
Messaggi: 3287
Grazie Gioz per aver approfondito la questione.
Che il turbo fosse stato ignorato e che l'indice non fosse precisissimo lo avevo già anticipato.
Che il valore del turbo però fosse così diverso dalla frequenza base dichiarata non lo sapevo. Ero rimasto a qualche centinaio di MHz quando il TPD lo permetteva (anche il mio 3770K ha il turbo, ma l'ho visto applicato solo un paio di volte e con un valore non superiore al 5%).
Siccome non ho tempo di stare a vedere per ogni processore a quale frequenza arriva secondo quale carico viene applicato, a meno che qualcuno di voi non abbia un elenco con le frequenze massime raggiunte con tutti i core attivi per i processori presi in esame, il lavoro di un recensore potrebbe essere benvoluto

Mi sembra che se si hanno tutti i numeri in mano il confronto può diventare interessante. Quantomeno qui si vede se e quanto l'HT ha realmente effetto a quanto quello implementato da AMD sia al pari (se non anche meglio) di quello realizzato da Intel, cosa che per esempio finora non ho mai trovato descritta e misurata da nessuna altra parte.

P.S: se avete una tabella delle frequenze di turbo con tutti i core attivi, potete mandarla qui e appena trovo un po' di tempo riprovo a rifare tutte le tabelle con i nuovi numeri. Grazie
CrapaDiLegno è offline   Rispondi citando il messaggio o parte di esso
Old 09-10-2017, 21:02   #12
Gioz
Senior Member
 
Iscritto dal: Feb 2005
Messaggi: 4972
purtroppo non so se siano note tutte le frequenze turbo applicate a seconda dei core sotto carico per ogni cpu in commercio, non so neanche se siano dichiarate ufficialmente da intel o solo derivate da prove specifiche (ad esempio anandtech e tom's le hann oriportate, almeno per alcune delle sku).
tra l'altro da oggi gira la notizia che intel con i prossimi processori non divulgherà più questo genere di informazione ma si limiterà a specificare max turbo e clock base, quindi non è chiaro se la situazione si complicherà ulteriormente in quest'ottica.

la tua per me rimane comunque un'ottima idea ed un progetto interessante, speriamo che qualche utente possa intervenire aggiungendo informazioni utili.
Gioz è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB Per Huawei l’IA è una questione di storag...
Recensione Google Pixel Tablet: in ritardo ma un ottimo primo passo! Recensione Google Pixel Tablet: in ritardo ma un...
ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED i per professionisti dell'immagine ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED...
HUAWEI WATCH FIT 3: lo smartwatch che ridefinisce design e fitness! Recensione HUAWEI WATCH FIT 3: lo smartwatch che ridefinisc...
HONOR 200 Lite, lo smartphone economico per ritratti, selfie, e non solo. La recensione HONOR 200 Lite, lo smartphone economico per ritr...
Corsair MP700 PRO SE: SSD PCIe 5 fino a ...
HUAWEI Pura 70 Ultra è il miglior...
Arriva in Italia la nuova gamma TV Samsu...
NVIDIA Grace Hopper è un successo...
Amazon Seconda Mano (ex Warehouse): pros...
Novità sulle Mappe di Apple: arri...
BYD insiste sull'Europa: nel 2025 second...
Il telescopio spaziale James Webb ha ril...
OPPO rende omaggio alle mamme con offert...
I nuovi Samsung Galaxy Book4 sono tutti ...
C'è un'app per tutto sui NAS di S...
Will Smith porta un suo team nelle gare ...
Tante offerte sugli iPhone 15 su Amazon:...
Bologna Game Farm: ecco i 4 videogiochi ...
Un detrito spaziale di una capsula Space...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 01:05.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Served by www1v