Microsoft Windows, sono questi i requisiti minimi degli AI PC? 16 GB di RAM e 40 TOPS di potenza [Archivio]

Redazione di Hardware Upg

19-01-2024, 08:11

Link alla notizia: https://www.hwupgrade.it/news/sistemi-operativi/microsoft-windows-sono-questi-i-requisiti-minimi-degli-ai-pc-16-gb-di-ram-e-40-tops-di-potenza_123519.html

Secondo voci di corridoio, Microsoft avrebbe fissato in 16 GB di memoria RAM il requisito minimo per gli AI PC. Si parla inoltre di 40 TOPS di potenza, valore che oggi Core Ultra e Ryzen non soddisfano.

Click sul link per visualizzare la notizia.

Ataru224

19-01-2024, 08:40

Il requisito della RAM è giustissimo (non solo per i computer con IA) ma deve essere imposto solo ai produttori, l'utente che vuole installare Windows su 4GB di RAM deve essere comunque libero di farlo

supertigrotto

19-01-2024, 09:31

Forse ho visto giusto,per Windows 12 o si cambia PC o si resta con Windows 11,come succede adesso per il 10 ,io con un 6600k devo restare al 10 ufficialmente.
Quindi mi sa che gli unici pronti saranno le serie 8000 di AMD e le ultime generazioni di Intel.
Un po' come quello che accade nel mondo smartphone

Opteranium

19-01-2024, 10:00

voglio 40 TOPA di potenza

Saturn

19-01-2024, 10:07

voglio 40 TOPA di potenza

...eh...e chi non li vorrebbe...:D

megthebest

19-01-2024, 10:26

s12a

19-01-2024, 13:44

Quello che conta oltre che il quantitativo di memoria è la banda passante. Con le DDR4 o anche DDR5 in dual channel si dorme ad aspettare la risposta rispetto a quasi qualsiasi GPU.

Un grafico un po' datato ma esplicativo. Le prestazioni sono direttamente proporzionali alla banda:

https://i.imgur.com/w6HAuQt.png

Un "token" è grossomodo una "parola".

LL1

20-01-2024, 17:39

Sarebbe interessante capire se eventuali sistemi desktop medio/basso di gamma attuali abbiano tale potenza..
Ad esempio, come si può capire quanta potenza in TOPS avrebbe una configurazione generica come la mia in firma? Ryzen 7 5800X + Gpu 2060 + 32Gb DDR4 3600Mhz CL16?
te lo dico io da uomo della strada:
il tuo PC, pur (secondo me ancora) ottimo (quantomeno per un uso a 360°; si avvicina peraltro al mio che ritengo tuttora degnissimo) non è conforme.
Al 99,..% sarà possibile installare 12 o quello che sarà ricorrendo però esclusivamente a trucchetti tipo quelli che si vedono mettere in campo oggi per poter utilizzare 11 su macchine prive di TPM, SecureBoot & compagnia.

Per come la vedo io almeno, non è possibile emulare in modo efficiente quello che sarò possibile ottenere con hardware dedicato, mettiti pure l'anima in pace ma quello che oggi è in giro difficilmente si salva se non ricorrendo a strategie varie (vedi sopra) ma a che prezzo.

E' interessante cmq la tua richiesta ("come si può capire quanta potenza in TOPS [...]"), speriamo qualcuno sia in grado di tirar giù una stima..

s12a

20-01-2024, 19:28

Escludendo la iGPU, a spanne per le CPU si potrebbe considerare 1 TFLOPS (in FP32) = 4 TOPS (in INT8), ma la conversione potrebbe non essere sempre corretta. Non credo ci siano ancora processori di fascia consumer/prosumer che arrivino a 1 TFLOPS, forse uno degli ultimi Threadripper potrebbe farcerla. Considerando anche la iGPU dovrebbe essere più facile.

La RTX2060 reference è data per circa 51-52 TFLOPS in FP16 sui tensor core; in INT8 in teoria dovrebbe essere numericamente il doppio, dunque 102-104 TOPS.

https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units#GeForce_20_series

In ogni caso come scritto in precedenza a grandi linee gli LLM (chatbot, generazione testo e simili, per dirla semplice) sono limitati principalmente dalla banda della memoria. Per ogni token generato, il contenuto del modello caricato deve essere letto interamente, perciò se abbiamo 500 GB/s di banda a disposizione ed il modello caricato in VRAM è di 16GB, al limite possiamo andare a 31.25 token/s. Nella pratica ci sono inefficienze varie che abbassano questo valore.

Per diversi tipi di IA generativa conta (ad esempio StableDiffusion) conta più la capacità computazionale—i TOPS. A parità di condizioni una RTX4090 genera immagini a circa il doppio della velocità di una RTX3090, ma con gli LLM durante l'inferenza vanno grossomodo uguale, avendo entrambe circa 1 TB/s di banda. Il discorso si ribalta per il training, dove nuovamente conta la potenza computazionale.