|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/cpu/te...ps_128115.html
Al COMPUTEX di Taipei tutte le società produttrici di processori e GPU hanno snocciolato le loro conquiste in termini di TOPS. Cosa c'è dietro questo nuovo parametro legato alle NPU? E perché è indicativo, ma non dice tutto, sulle prestazioni dei processori per l'IA? Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jun 2004
Città: Corte del Re Cremisi
Messaggi: 18841
|
![]()
__________________
CPU: 5800X3D SK Video: 4070ti Asus TUF OC MADREBOARD: Asus B550 non ricordo che modello RAM: Corsair Vengeance 4x8GB 3600 mhz HEATSINK Noctua NH-D15 NVME Corsair MP600 PRO 2TB + Silicon Power gen3 1TB PSU EVGA Supernova 650 G3 CASE Fractal Design North TV LG: C1 48" C2 65" B4 65" MONITOR Lg 27GN88A KEYBOARD Ducky One 3 TKL ITA MOUSE Razer Basilisk HANDLED Steam Deck Thread ASPETTANDO SILENT HILL 2 REMAKE 2023 ![]() ![]() |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Aug 2006
Città: Valdagno
Messaggi: 5129
|
Sembrerà una cosa strana ma,la IA funziona meglio con istruzioni da 4/8 o massimo 16 bit,andare oltre rallenta il sistema.
|
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Aug 2017
Messaggi: 1296
|
OTTIMA idea mettere gli editoriali nel weekend, altrimenti senza notizie il sito diventa tutta pubblicità, e rispetto alle suddette notizie che si possono trovare anche su altre fonti gli editoriali impreziosiscono i contenuti con riflessioni originali
|
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Oct 2002
Messaggi: 5418
|
TOPS OF THE CHIPS
__________________
____€UROPA: INSIEME di STATI IN COMUNANZA DI PROSPETTIVE PAGLIACCE |
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jan 2002
Città: non ti interessa
Messaggi: 5605
|
Gli unici TOPS che mi interessano sono quelli delle ragazze
![]() Che porcone che sono ![]() ![]() ![]() ![]()
__________________
[url="http://www.hwupgrade.it/forum/showthread.php?t=2119003"]- Compilatore Intel e disparità di trattamento verso processori AMD/VIA |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Feb 2004
Messaggi: 5993
|
più TOPS(a) per tutti
![]() |
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2007
Messaggi: 6010
|
Quote:
![]() Gli algoritmi su cui si basa il funzionamento dei LLM, come pure altri basati su modelli di reti neurali, per dirla in modo semplice eseguono un sacco di moltiplicazioni matriciali. I singoli valori nelle matrici rappresentano il peso/forza di una connessione e si è verificato che con matrici molto grandi si ottengono buoni risultati anche se il singolo valore viene rappresentato con 16bit o meno (tipicamente 16bit oppure 8bit). Quindi se invece di usare dei float a 32bit usi ad esempio degli interi ad 8bit, la matrice occupa molta meno ram e quando leggi/scrivi su ad esempio un bus a 64bit, in un colpo solo puoi trasferire 8 coefficienti ad 8bit invece di 2 a 32bit ( trasferisci il quadruplo). Lo stesso discorso vale per le ALU SIMD, perche ad esempio se hai registri SIMD a 256bit, puoi potenzialmente eseguire simultaneamente ben 8 operazioni su valori a 32bit oppure 32 operazioni su valori ad 8 bit. Sono i singoli valori delle matrici ad essere a 16, 8, 4, 1 bit, ma le istruzioni ed i registri sono tutto un altro paio di maniche. Le NPU semplicemente supportano in hardware formati di dati tipo FP16, FP8 e sono ultra-ottimizzate per essi e per eseguire moltiplicazioni di matrici in tali formati. Per questo i TOPS delle NPU sono da intendersi solo come prestazioni per gli algoritmi "per AI" (tipicamente vengono indicate le prestazioni con dati in formato INT8 oppure FP8). |
|
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Feb 2004
Messaggi: 5993
|
Quote:
![]() |
|
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: Mar 2009
Messaggi: 398
|
Concordo anche io
|
![]() |
![]() |
![]() |
#11 | ||
Senior Member
Iscritto dal: Jun 2015
Messaggi: 2837
|
Quote:
Quote:
![]() |
||
![]() |
![]() |
![]() |
#12 |
Senior Member
Iscritto dal: Sep 2022
Messaggi: 1705
|
Ok, stiamo andado sulla strada dell'avere x tutti in ogni cosa l'IA anche nelle cose piu' inutili, magari tra un po' a ciascuno sara' assegnata un'IA personale che ci possa assistere 24/24 e controllore in ogni cosa e quando ne saremo piu' che contenti ed abituati ad essere serviti... metteranno tutto a pagamento? HAHAHA
|
![]() |
![]() |
![]() |
#13 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 5835
|
E la differenza con il FLOPS quale sarebbe? Che il TOPS è più generico?
|
![]() |
![]() |
![]() |
#14 |
Senior Member
Iscritto dal: Jun 2007
Città: Casnate con Bernate
Messaggi: 2092
|
I flops sono le operazioni al secondo in virgola mobile. Numeri puri.
i tops sono invece il numero di tensori calcolati al secondo che si usano ovviamente per i modelli IA. Si entra nel campo dell'algebra vettoriale multidimensionale. Roba abbastanza complicata. Sono due cose differenti. Non penso si possano paragonare.
__________________
PSU: Seasonic M12II-620 Evo MB: MSI X370 Sli Plus CPU: AMD Ryzen 7 5700X SSD: Kingston SA400S37/240GB RAM: 2x 16GB DDR4 3200MHz SCHEDA VIDEO: SAPPHIRE RX 6700 Pulse OC 10GB S.O.: bazzite.gg |
![]() |
![]() |
![]() |
#15 | ||
Senior Member
Iscritto dal: Nov 2002
Messaggi: 5835
|
Quote:
Quote:
Ultima modifica di Unrue : 24-06-2024 alle 10:54. |
||
![]() |
![]() |
![]() |
#16 |
Senior Member
Iscritto dal: Jun 2007
Città: Casnate con Bernate
Messaggi: 2092
|
Hmm.. Non lo so a sto punto.
Io sapevo appunto che misurava quante "tensor operation" al secondo eseguiva una gpu. Però boh qui salta fuori una nuova definizione ogni giorno. Alla fine è tutta fuffa in ogni caso. Sui portatili con le npu la roba seria non la farai mai girare in locale data la scarsità di ram e vram. Insomma per ora sono tutti specchietti per gli allodole e per alimentare il FOMO legato all'hardware.
__________________
PSU: Seasonic M12II-620 Evo MB: MSI X370 Sli Plus CPU: AMD Ryzen 7 5700X SSD: Kingston SA400S37/240GB RAM: 2x 16GB DDR4 3200MHz SCHEDA VIDEO: SAPPHIRE RX 6700 Pulse OC 10GB S.O.: bazzite.gg |
![]() |
![]() |
![]() |
#17 |
Senior Member
Iscritto dal: Sep 2022
Messaggi: 1705
|
Visto che la GPU ha i tensore cores, oltre ai classici dati dovrebbero anche per Loro mettere queste info?
|
![]() |
![]() |
![]() |
#18 |
Senior Member
Iscritto dal: Jan 2007
Messaggi: 6010
|
Date un occhiata a questo articolo:
https://news.ucsc.edu/2024/06/matmul-free-llm.html Ed alla pubblicazione di cui parla: https://arxiv.org/pdf/2406.02528 Per dirla in poche parole ... i chip e gli "acceleratori AI" attualmente o prossimamente disponibili ... sono TUTTI obsoleti. ![]() E' stato messo a punto un nuovo metodo che ELIMINA L'USO DELLE MOLTIPLICAZIONI DI MATRICI "classiche" usando la quantizzazione ternaria (coefficienti con solo tre valori, ovvero -1, 0, +1 ). Già ora, portando gli algoritmi con coefficienti ternari su GPU "normali" si riducono enormemente la memoria utilizzata, i consumi energetici e si aumentano le prestazioni. Quando saranno disponibili NPU "matmul-free" (ma con supporto delle operazioni su coefficienti ternari) le prestazioni schizzeranno alle stelle anche su sistemi embedded. Mi sa che in questi giorni tutti quelli che stanno lavorando su chip "AI" stanno freneticamente bloccando tutti gli sviluppi in corso che non siano troppo vicini alla produzione o vincolati da contratti e stanno ri-progettando le loro architetture. Chi arriva primo a produrre in quantità NPU "matmul-free" anche usando processi produttivi "vecchi" può far piazza pulita di tutti i prodotti attualmente in commercio (con chip che a parità di consumo danno prestazioni stellari anche usando un processo produttivo "non all'ultimo grido"). |
![]() |
![]() |
![]() |
#19 | |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 5835
|
Quote:
La quantizzazione dei pesi non è un'idea nuova, ma fino ad ora non ha portato a risultati comparabili. Vedremo. |
|
![]() |
![]() |
![]() |
#20 | |
Senior Member
Iscritto dal: Oct 2002
Messaggi: 5418
|
Quote:
si tratta di classifiche: TOPS of THE FLIPS of THE FLOPS of THE HWS of THE POPS. E assortiti.
__________________
____€UROPA: INSIEME di STATI IN COMUNANZA DI PROSPETTIVE PAGLIACCE |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 12:50.