|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/cpu/av...io_103748.html
Finora sulle motherboard Z690 e i processori Alder Lake era possibile attivare il set di istruzioni AVX-512, a patto di disabilitare gli E-core. Questa opzione non sarà però più possibile, Intel ha deciso di rimuoverla con un nuovo microcode che sta raggiungendo gli ultimi BIOS. Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3484
|
Ho il dubbio che tra le modifiche ai prossimi P-core di RaptorLake ci sarà la rimozione proprio dell'unità AVX-512, mentre Intel ha detto che i core Gracemont rimarranno uguali.
Dovrebbe ridurre le dimensioni del P-core e magari anche un po' i consumi. |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Nov 2000
Città: Varees
Messaggi: 9145
|
Non ricordo la fonte, ma il concetto era questo: I core x86, grazie alle estensioni e soprattutto all HT/SMT sono molto complessi da un punto di vista del silicio, in confronto agli ARM.
Che si stia andando verso una semplificazione? Forse. |
![]() |
![]() |
![]() |
#4 | |
Senior Member
Iscritto dal: Oct 2010
Messaggi: 9176
|
Quote:
![]()
__________________
CPU: R5 7600 MOBO: ROG B650E-I RAM: G.Skill 32GB 6000 C30 GPU: RX 9070 XT NVMe: SN850X 1TB PSU: Seasonic SGX-750 CASE: MiniNeo S400 |
|
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: May 2004
Messaggi: 7381
|
un unita non utilizzata non consuma
|
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Nov 2000
Città: Varees
Messaggi: 9145
|
ma occupa spazio
|
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: May 2004
Messaggi: 7381
|
|
![]() |
![]() |
![]() |
#8 |
Senior Member
Iscritto dal: Sep 2011
Messaggi: 912
|
speriamo di avere più informazioni tecniche sulla questione...anche se credo come detto sopra più una situazione stile quadro, geforce dove certe cose le metteranno sugli xeon o sulla fascia main quando sarà veramente necessario.
Poi se parte del lavoro delle avx può essere fatto dai tensor core sulla cpu è sicuramente una soluzione custom ma da studiare. |
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Apr 2002
Città: VR-PD
Messaggi: 11579
|
Quote:
Era vero 40 anni fa, oggi non più Apple M1 pro ha 33 milioni di transistor e M1 Max 57 milioni I Ryzen senza GPU stanno sui 6 milioni di transistor per 8 core Il Threadripper da 64 core si ferma a 40 milioni Intel non dice il numero dei transistor, ma le stime parlano di 8-10 milioni con la GPU per rocket lake Qual è la CPU più complicata ? Al contrario, si va verso una sempre più elevata complicazione
__________________
Ph'nglui mglw'nafh Cthulhu R'lyeh wgah'nagl fhtagn |
|
![]() |
![]() |
![]() |
#10 | ||
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3484
|
Lo credi tu.
Se non hai un layer di alimentazione separato, i transistor di quell'unità consumeranno in leakage eccome. Quote:
Siccome i die per le versioni server non sono gli stessi delle versioni a Intel costerebbe zero eliminare le unità AVX-512. Io scommetto che con RaptorLake le unità AVX-512 spariranno dai P-core. Sono unità troppo specializzate e dal costo troppo alto per avere un senso nel mercato consumer. In più portano tutta una serie di problematiche come la riduzione delle frequenze anche per le istruzioni normali quando si attivano. E comunque anche se fossero gli stessi die tra server e consumer (come per AMD) dipende da quanti mm^2 alla fine sprechi in totale. Fai 1000 CPU per server e 1.000.000 consumer? Sprechi 10.000.000 di mm^2 in totale sulle CPU consumer che non hanno utilità? Quanto costano? Quanto costa fare una versione del die apposita? Non siamo certo noi a dover insegnar loro questo tipo di calcoli, ma se qualcosa non serve, è grande e costa stai pur sicuro che il pensiero se eliminarla o meno se lo pongono. Quote:
Comunque si parla di unità in estensione al core, non parti del core vero e proprio. Posso esserci come non esserci e non cambia come è fatto il core. La semplificazione, indipendentemente dal numero di transistor, è sul flusso dei dati. Core SMT/HT richiedono tutta una serie di transistor aggiuntivi per fare operazioni "fuori banda" per aliasing e riordinazione e sostituzione, accessi alla memoria doppi, sfruttamento inferiore delle cache, cosa che un core monothread non incorre. E sono tutti transistor/banda che possono essere usati per incrementare le capacità di calcolo del core invece di cercare di sfruttare i periodi morti che sono sempre meno man mano che si cerca di aumentare l'IPC. Ultima modifica di CrapaDiLegno : 07-01-2022 alle 11:49. |
||
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7381
|
Quote:
Una cpu con la igpu disabilitata consuma lo stesso a livello di mmw eppure ci sono miliardi di transistor |
|
![]() |
![]() |
![]() |
#12 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3484
|
Quote:
Inoltre "attivare" una unità con una alimentazione separata significa latenza infinita (o credi che puoi togliere e mettere corrente nei circuiti con intervalli di nanosecondi?) Quindi tutte le unità è una gran ca**ata. Infatti un 12900K non consuma come un 12400 in idle (dove le unità non usate sarebbero non alimentate secondo te). Così come una GPU a cui "tagli" le unità difettose non consuma proporzionalmente meno rispetto ad una GPU in cui le unità proprio non sono montate. Intel storicamente aveva un PP di vantaggio con rese elevatissime sugli altri e sfornava CPU una dietro l'altra, e quindi qualche mm^2 in più di silicio non era un problema se voleva dire tempi di sviluppo ridotti. Ora con il fatto che ha un PP pessimo che consuma con rese ridotte, il problema si presenta esattamente come lo si presentava agli altri prima. Vediamo se sui RaptorLake ci saranno le unità AVX-512. Di sicuro non ci saranno su MeteorLake che sarà una rivisitazione completa di tutta l'architettura su nuovo PP. Non avrebbe alcun senso lasciarle per disabilitarle dopo. I consumi statici ci sono e resterebbero. Ultima modifica di CrapaDiLegno : 07-01-2022 alle 12:25. |
|
![]() |
![]() |
![]() |
#13 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7381
|
Quote:
|
|
![]() |
![]() |
![]() |
#14 |
Senior Member
Iscritto dal: Sep 2004
Città: Veneto Orientale
Messaggi: 4311
|
Attenderemo i BIOS MOD, come fù per attivare il supporto per il BOOT da PCI-E sui chipset X79 per gli SSD MVE, avere un hardware che supporta alcune caratteristiche e castrarlo e un peccato, ci stà un gruppo che addirittura fa funzionare processori su mobo con chipset che NON li supportano, e ci stanno già lavorando, e io amo gli emulatori, emulare il processore CELL necessita le AVX-512 per l'emulazione delle SPE ad una velocità devente.
Ultima modifica di Gringo [ITF] : 07-01-2022 alle 12:56. |
![]() |
![]() |
![]() |
#15 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3484
|
Quote:
E non è che serva molto per aumentare i consumi. Questi 10nm di Intel non sono ancora come i 7nm di TSMC. Certo sono meglio degli ormai stra abusati e vetusti 14nm, ma non sono allo stesso livello. Finché Intel non passa ad usare l'EUV anche lei non c'è modo di raggiungere la qualità del PP di TSMC. Probabilmente il pareggio/sorpasso lo si avrà con Intel4 (o i 7nm Intel come si vuole chiamarli). |
|
![]() |
![]() |
![]() |
#16 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3484
|
Quote:
|
|
![]() |
![]() |
![]() |
#17 |
Senior Member
Iscritto dal: Sep 2004
Città: Veneto Orientale
Messaggi: 4311
|
Pat Gelsinger, stà semplicemente facendo quello che "L'amministrazione" precedente non ha fatto, quindi...
1) Marketing Continuo 2) Non farsi sfuggire le teste (in questo caso riprendersele) 3) Far uscire l'innovazione e non tenerla nei cassetti A Pat Gelsinger Intel deve fare un monumento pari a quello che noi Italiani dovremmo fare ad ILIAD quando è arrivata in ITALIA.... :3 Un poca di COMPETIZIONE vera serve, vedi che peperone queste mosse ha dato a AMD che ha anticipato di 18 mesi tutto... :3 |
![]() |
![]() |
![]() |
#18 |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3484
|
POca innovazione Intel prima di Pat?
E certo, facile innovare quando hai PP nuovi. Prova a fare qualcosa quando gli enormi investimenti nel nuovo PP non danno i propri frutti. Con i 14nm Intel ha fatto i miracoli, altro che "non ha fatto". |
![]() |
![]() |
![]() |
#19 |
Senior Member
Iscritto dal: Jan 2007
Messaggi: 5943
|
La mia impressione é che AVX-512 sia stato un passo falso per Intel, avessero implementato un estensione vettoriale come SVE/SVE2 di ARM e le estensioni "V" di Risc-V (che permettono di allargare e restringere le ALU vettoriali a piacere tra un core e l'altro, mantenendo piena compatibilità) non si sarebbero ritrovati in questa situazione grottesca in cui le AVX-512 sono troppo ingombranti in certi contesti ed ora é stato introdotto un nuovo set di registri per le AMX (e nuovamente vincolando il tutto a registri di dimensione prefissata nell'estensione stessa).
Intel può parlare fin che vuole delle sue librerie che supportano automaticamente le estensioni disponibili, ma c'é una notevole differenza rispetto a codice generato da un compilatore che sfrutta direttamente le estensioni disponibili senza continue chiamate e ritorni da subroutine (e no, la compilazione JIT non é una soluzione altrettanto efficace). |
![]() |
![]() |
![]() |
#20 | ||||||||||||||||||||||||
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Quote:
![]() Quote:
Quote:
Quote:
per chi volesse continuare a godere dei benefici di questo set d'istruzioni. ![]() Quote:
Quote:
Poi l'HyperThreading occupa poco silicio. Quote:
- la dimensione effettiva dei registri; - la dimensione effettiva delle porte di esecuzione per quelle in grado di accogliere istruzioni AVX-512. AVX-512 richiede parecchio spazio. Anche questo è il motivo per cui i P-Core sono così grossi rispetto agli E-Core. Quote:
Quote:
Mettiamo che, ad esempio, stai manipolando dati in virgola mobile a doppia precisione. In un registro a 512 bit di AVX-512 ce ne possono stare 8. Quindi hai 8 lane, che controlli tramite i registri di maschera e il relativo meccanismo di predicazione, dove un bit del registro maschera controlla se l'operazione dev'essere applicata o meno a quella lane. Ebbene, durante le operazioni, se una lane non è attiva l'ALU può essere spenta, visto che per quel dato non serve effettuare l'operazione (in questo caso o viene mantenuto lo stesso valore, oppure viene azzerato). E' con questi "trucchetti" che si riesce a far scendere un po' i consumi di unità energivore come queste. Ma similmente si fa con le AVX: quando non vengono usati 128 bit alti dei registri o ALU a 256 bit, queste parti vengono spente. Quote:
Quote:
Quote:
L'importante, in entrambi i casi, è il risultato finale: che le prestazioni migliorino. Quote:
Il motivo è proprio quello che immagini: costa parecchio realizzare dei core appositi. Oggi soltanto per realizzare un processore servono gruppi di lavori di 500-1000 ingegneri, impiegati per 2-3 anni (a seconda che si tratti di aggiornamenti di una microarchitettura, o di una nuova architettura). A cui si aggiungono altri 2-3 di testing da parte di altri ingegneri, prima di arrivare in commercio. In tutto ciò ci sono poi altri impiegati che si occupano di vari altri aspetti (project management, QA, ecc.). Non è pensabile, quindi, di fare lo stesso per ogni nuovo core. E' molto più economico, nonché comodo, lavorare a un solo core, e poi disabilitarne alcune parti alla bisogna. Il resto lo farà l'economia di scala e l'uso di processi produttivi sempre più avanzati (che consentono di ridurre lo spazio occupato dalle parti non usate). Quote:
L'uso della banda dipende dal carico di lavoro in un preciso momento. Comunque ci sono anche politiche di allocazione / prioritizzazione dell'uso delle risorse. Ciò che conta alla fine è sempre la stessa cosa: il risultato. L'HT/SMT offre chiaramente un vantaggio in core di grosse dimensioni, dove ci sono un sacco di risorse nonché unità di esecuzione. I test parlano chiaro. Quote:
Quote:
Quote:
Igor's Lab ha fatto dei test in merito. Tra l'altro pure il 12900K si è mostrato efficiente in diversi scenari. Quote:
Lo vedremo meglio con le soluzioni mobile di Intel, quando saranno a confronto con quelle della concorrenza basate su TSMC. Quote:
Quote:
Quote:
Quote:
Le AVX-512 nascono dalle ceneri di Larrabee, dei successivi progetti Knight *. Quindi parliamo di PARECCHI anni fa. Quando le ha presentate le sue SVE Arm? E quando il consorzio RISC-V? Hanno avuto tutto il tempo per pensare a soluzioni più scalabili. Nonostante tutto RISC-V ha tirato fuori un'ISA SIMD estremamente complessa che, come ti ho riportato in un recente commento, sta creando parecchi problemi a chi la vuole implementare anche su sistemi embedded. Tant'è che alcuni produttori di chip parlano di implementarne soltanto un sottoinsieme. Il che significherebbe l'n-esimo (perché mica è la prima estensione che cannino) errore di progettazione di questi accademici che hanno i piedi ben poco piantati per terra e pensano più a soddisfare la loro voglia accademica di soluzioni teoricamente perfette. Altra cosa, il modello a registri di dimensione fissa ha anche i suoi perché e i suoi vantaggi. Ed è esattamente il motivo per cui non solo ARM con Neon (che NON ha abbandonato), ma anche RISC-V con l'estensione P, hanno adottato estensioni SIMD di questo tipo. D'altra parte se vedi come funzionano le estensioni vettoriali "length-agnostic" puoi vedere tu stesso che è difficile adattarle a tutte le problematiche relative al massiccio calcolo vettoriale. Soprattutto la soluzione RISC-V è molto limitante, potendo lavorare esclusivamente su un vector length alla volta, e per giunta con un solo tipo di dato pre-impostato prima del loop vettoriale. Quindi ci starei molto attento a incensare queste soluzioni disprezzando quelle a lunghezza fissa... Quote:
Quindi è molto simile alle virtual table, insomma. Ed è abbastanza efficiente. Si potrebbe fare di meglio in merito (ho delle idee in merito), ma servirebbe un po' di sperimentazione.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
||||||||||||||||||||||||
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 01:00.