AVX-512 sulle CPU Alder Lake, il matrimonio è finito: i nuovi BIOS sanciscono il divorzio

AVX-512 sulle CPU Alder Lake, il matrimonio è finito: i nuovi BIOS sanciscono il divorzio

Finora sulle motherboard Z690 e i processori Alder Lake era possibile attivare il set di istruzioni AVX-512, a patto di disabilitare gli E-core. Questa opzione non sarà però più possibile, Intel ha deciso di rimuoverla con un nuovo microcode che sta raggiungendo gli ultimi BIOS.

di pubblicata il , alle 10:31 nel canale Processori
Alder LakeIntelCore
 

Intel ha deciso di disabilitare il set di istruzioni AVX-512 sui processori Alder Lake, i nuovi Core di 12a generazione. AVX-512 è "tecnicamente" supportato solo dai P-core Golden Cove e di conseguenza l'uso dell'istruzione disattiva gli E-core (Gracemont). Il funzionamento congiunto dei due tipi di core richiede infatti la parità a livello di istruzioni supportate.

Gli ultimi BIOS (basati sul microcode 18) di schede madri come la MSI Z690 Unify, segnala il sito hardwareLuxx, seppur mostrino ancora la voce per abilitare AVX-512, non attivano più realmente il set di istruzioni, mettendo così la parola fine su un supporto che, ufficialmente, Intel non ha mai riconosciuto.

hardwareLuxx ha avuto modo di provare anche una motherboard MSI MAG B660M MORTAR WIFI DDR4 di prossima uscita rilevando come la voce nel BIOS sia del tutto assente. ASUS ha confermato la disattivazione del supporto AVX-512 con i prossimi BIOS per motherboard Z690 e l'assenza al supporto di default sui modelli H670, B660 e H610.

Come mai Intel ha permesso di attivare AVX-512 su Alder Lake finora disabilitando gli E-core? Stando a quanto ricostruito dal sito tedesco Igor's Lab nelle scorse settimane, il tutto è avvenuto per errore, in quanto si è lasciata la possibilità ai produttori di motherboard di integrare AVX-512 intervenendo sul microcode del BIOS e questi l'anno fatto, malgrado Intel abbia sempre parlato di AVX-512 come di un set di istruzioni non ufficialmente supportato da Alder Lake.

AVX-512 è in grado di accelerare le prestazioni delle CPU per i carichi di lavoro e i modelli di utilizzo come le simulazioni scientifiche, l'analisi finanziaria, l'intelligenza artificiale (AI) e il deep learning e molto altro. In base ad alcuni test, si è rivelato molto utile per accelerare le prestazioni dell'emulatore PS3 RPCS3. Allo stesso tempo, alcune prove di Igor's Lab hanno rilevato che AVX-512 funziona in modo più efficiente di AVX2.

Comunque sia, se avete bisogno delle istruzioni AVX-512 sul vostro sistema Alder Lake non vi resta che dotarvi di una motherboard Z690 e di un BIOS che non è stato aggiornato all'ultima versione del microcode di Intel. Tra l'altro, il nuovo microcode impone anche un limite per il moltiplicatore di 51 (5,1 GHz) quando si usa il set di istruzioni AVX2. Questo limite è presente su tutte le motherboard Alder Lake, ma il nuovo codice impedisce di oltrepassarlo. Non è chiaro se questa scelta sia una risposta a problemi rilevati o una misura cautelativa per prevenire potenziali problemi in futuro.

24 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
CrapaDiLegno07 Gennaio 2022, 10:43 #1
Ho il dubbio che tra le modifiche ai prossimi P-core di RaptorLake ci sarà la rimozione proprio dell'unità AVX-512, mentre Intel ha detto che i core Gracemont rimarranno uguali.
Dovrebbe ridurre le dimensioni del P-core e magari anche un po' i consumi.


frankie07 Gennaio 2022, 10:55 #2
Non ricordo la fonte, ma il concetto era questo: I core x86, grazie alle estensioni e soprattutto all HT/SMT sono molto complessi da un punto di vista del silicio, in confronto agli ARM.

Che si stia andando verso una semplificazione? Forse.
StylezZz`07 Gennaio 2022, 11:08 #3
Originariamente inviato da: Redazione di Hardware Upgrade
In base ad alcuni test, si è rivelato molto utile per accelerare le prestazioni dell'emulatore PS3 RPCS3


Allora sono felice di avere Rocket Lake
coschizza07 Gennaio 2022, 11:24 #4
Originariamente inviato da: CrapaDiLegno
Ho il dubbio che tra le modifiche ai prossimi P-core di RaptorLake ci sarà la rimozione proprio dell'unità AVX-512, mentre Intel ha detto che i core Gracemont rimarranno uguali.
Dovrebbe ridurre le dimensioni del P-core e magari anche un po' i consumi.


un unita non utilizzata non consuma
frankie07 Gennaio 2022, 11:26 #5
ma occupa spazio
coschizza07 Gennaio 2022, 11:32 #6
Originariamente inviato da: frankie
ma occupa spazio


le unita avx 512 sono parte delle avx 256 quindi lo spazio occupato e minimo e la cpu viene usata nel mercato server e workstation dove l'unita viene attivata quindi costa di piu eliminarla
demonsmaycry8407 Gennaio 2022, 11:40 #7
speriamo di avere più informazioni tecniche sulla questione...anche se credo come detto sopra più una situazione stile quadro, geforce dove certe cose le metteranno sugli xeon o sulla fascia main quando sarà veramente necessario.
Poi se parte del lavoro delle avx può essere fatto dai tensor core sulla cpu è sicuramente una soluzione custom ma da studiare.
Cfranco07 Gennaio 2022, 12:01 #8
Originariamente inviato da: frankie
Non ricordo la fonte, ma il concetto era questo: I core x86, grazie alle estensioni e soprattutto all HT/SMT sono molto complessi da un punto di vista del silicio, in confronto agli ARM.

Ancora con questa storia ?
Era vero 40 anni fa, oggi non più
Apple M1 pro ha 33 milioni di transistor e M1 Max 57 milioni

I Ryzen senza GPU stanno sui 6 milioni di transistor per 8 core
Il Threadripper da 64 core si ferma a 40 milioni

Intel non dice il numero dei transistor, ma le stime parlano di 8-10 milioni con la GPU per rocket lake

Qual è la CPU più complicata ?

Originariamente inviato da: frankie
Che si stia andando verso una semplificazione? Forse.


Al contrario, si va verso una sempre più elevata complicazione
CrapaDiLegno07 Gennaio 2022, 12:36 #9
Originariamente inviato da: coschizza
un unita non utilizzata non consuma

Lo credi tu.
Se non hai un layer di alimentazione separato, i transistor di quell'unità consumeranno in leakage eccome.

Originariamente inviato da: coschizza
le unita avx 512 sono parte delle avx 256 quindi lo spazio occupato e minimo e la cpu viene usata nel mercato server e workstation dove l'unita viene attivata quindi costa di piu eliminarla


Anche qui non è mica vero.
Siccome i die per le versioni server non sono gli stessi delle versioni a Intel costerebbe zero eliminare le unità AVX-512.
Io scommetto che con RaptorLake le unità AVX-512 spariranno dai P-core. Sono unità troppo specializzate e dal costo troppo alto per avere un senso nel mercato consumer.
In più portano tutta una serie di problematiche come la riduzione delle frequenze anche per le istruzioni normali quando si attivano.

E comunque anche se fossero gli stessi die tra server e consumer (come per AMD) dipende da quanti mm^2 alla fine sprechi in totale.
Fai 1000 CPU per server e 1.000.000 consumer?
Sprechi 10.000.000 di mm^2 in totale sulle CPU consumer che non hanno utilità? Quanto costano? Quanto costa fare una versione del die apposita?
Non siamo certo noi a dover insegnar loro questo tipo di calcoli, ma se qualcosa non serve, è grande e costa stai pur sicuro che il pensiero se eliminarla o meno se lo pongono.

Originariamente inviato da: Cfranco
Ancora con questa storia ?
Era vero 40 anni fa, oggi non più
Apple M1 pro ha 33 milioni di transistor e M1 Max 57 milioni

I Ryzen senza GPU stanno sui 6 milioni di transistor per 8 core
Il Threadripper da 64 core si ferma a 40 milioni

Intel non dice il numero dei transistor, ma le stime parlano di 8-10 milioni con la GPU per rocket lake

Qual è la CPU più complicata ?

Al contrario, si va verso una sempre più elevata complicazione


Sono MILIARDI, non milioni.
Comunque si parla di unità in estensione al core, non parti del core vero e proprio. Posso esserci come non esserci e non cambia come è fatto il core.
La semplificazione, indipendentemente dal numero di transistor, è sul flusso dei dati.
Core SMT/HT richiedono tutta una serie di transistor aggiuntivi per fare operazioni "fuori banda" per aliasing e riordinazione e sostituzione, accessi alla memoria doppi, sfruttamento inferiore delle cache, cosa che un core monothread non incorre. E sono tutti transistor/banda che possono essere usati per incrementare le capacità di calcolo del core invece di cercare di sfruttare i periodi morti che sono sempre meno man mano che si cerca di aumentare l'IPC.
coschizza07 Gennaio 2022, 12:41 #10
Originariamente inviato da: CrapaDiLegno
Lo credi tu.
Se non hai un layer di alimentazione separato, i transistor di quell'unità consumeranno in leakage eccome.


tutte le unita di esecuzione sono create con alimentazioni separate per andare in idle all'occorrenza quindi il consumo è pari a 0. Intel storicamente ha sempre detto che costa piu togliere del silicio che lasciarlo li dove sta e inutilizzato.
Una cpu con la igpu disabilitata consuma lo stesso a livello di mmw eppure ci sono miliardi di transistor

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^