Questa GPU NVIDIA di 8 anni fa umilia schede moderne nell'AI: costa appena 100 dollari

Questa GPU NVIDIA di 8 anni fa umilia schede moderne nell'AI: costa appena 100 dollari

La storica NVIDIA Tesla V100, GPU per datacenter introdotta nel 2017, torna sotto i riflettori grazie a nuovi test su modelli AI LLM. Nonostante l'età, la scheda basata su architettura Volta ha mostrato prestazioni e consumi competitivi contro le GPU consumer più recenti, a fronte però di modifiche hardware complesse.

di pubblicata il , alle 12:01 nel canale Schede Video
NVIDIA
 

A distanza di otto anni dal debutto, la GPU per datacenter NVIDIA Tesla V100 torna a far parlare di sé grazie a una serie di benchmark dedicati all'esecuzione locale di modelli AI LLM. I test, realizzati dal canale Hardware Haven, mostrano come una scheda professionale basata su architettura Volta riesca ancora oggi a competere con soluzioni consumer molto più recenti in specifici carichi di lavoro legati all'intelligenza artificiale.

La Tesla V100 rappresentò un passaggio importante per NVIDIA, essendo la prima famiglia pensata esclusivamente per il settore datacenter e la prima ad adottare i Tensor Core, oggi elemento centrale delle accelerazioni AI della società. La GPU testata è una variante SXM2 con 5120 CUDA Core, 640 Tensor Core, 16 GB di memoria HBM2 su bus a 4096 bit e bandwidth di 898 GB/s. Il TDP dichiarato è di 250 W, decisamente inferiore rispetto alle moderne piattaforme AI di fascia alta.

All'epoca del lancio, il prezzo della Tesla V100 superava i 10.000 dollari, mentre oggi le versioni usate da 16 GB possono essere reperite sul mercato secondario per circa 100 dollari. Tuttavia, utilizzare una GPU SXM2 in un comune PC desktop non è immediato: il formato richiede adattatori dedicati SXM-to-PCIe, alimentazione specifica e un sistema di raffreddamento personalizzato.

Nel test è stato necessario realizzare una soluzione termica artigianale con condotto stampato in 3D e ventola Noctua dedicata, poiché le Tesla V100 nascono per operare in server con raffreddamento passivo e flusso d'aria controllato. Sommando GPU, adattatore e modifiche, il costo complessivo del progetto ha superato di poco i 200 dollari.

Clicca per ingrandire

I risultati ottenuti con modelli LLM locali sono comunque interessanti. Nel benchmark con GPT-oss 20B, la V100 ha raggiunto circa 130 token al secondo, contro i circa 90 token/s registrati dalla Radeon RX 7800 XT. Anche rispetto alla GeForce RTX 3060 da 12 GB, la soluzione Volta ha mostrato un vantaggio significativo nei test con Gemma4:e4b tramite Ollama e Open WebUI.

Secondo i dati condivisi, la V100 ha garantito una velocità di generazione token superiore del 42% rispetto alla RTX 3060, mantenendo anche una migliore efficienza energetica. Limitando entrambe le GPU a 100 W, la scheda datacenter ha conservato un vantaggio del 41% nel rapporto token/sec/watt.

Clicca per ingrandire

I risultati evidenziano come alcune GPU professionali di precedente generazione possano ancora offrire valore nei workload AI moderni, specialmente grazie alla presenza dei Tensor Core e dell'elevata bandwidth della memoria HBM2. Rimangono però diversi limiti pratici dovuti alle modifiche necessarie per farla funzionare, non alla portata di tutti gli utenti.

Le versioni da 32 GB della Tesla V100, oggi vendute tra 400 e 500 dollari, potrebbero inoltre risultare ancora più interessanti per modelli AI di dimensioni superiori, dove la capacità della VRAM continua a rappresentare uno dei principali vincoli operativi.

5 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
r134811 Maggio 2026, 14:15 #1
Va beh, hanno confrontato una GPU nata per il machine learning in datacenter con delle GPU gaming di fascia medio-bassa.
Anche oggi il premio "grazie al c...o" è stato assegnato.
OrazioOC11 Maggio 2026, 14:46 #2
Livello dell'articolo: WCCFtech.
UtenteHD11 Maggio 2026, 15:25 #3
Da quanto si legge su github (da verificare) i modelli AI python avviato in locale "portable" da .bat girano egregiamente anche in una entry level 3050, basta avere min 32GB + swap di RAM ed ovviamente più VRAM hai meglio è, ma anche min 6GB vanno bene da quanto indicato.
Se si usa una vecchia scheda più portata per queste cose, ci credo che renda meglio, ma son 250W, contro i 70W, o 115W o 130W.
Ho letto anche che un vecchio driver nvidia cercare quale, rende quasi 10x da quelli attuali senza cambiare GPU.
Cmq è tutto scritto su github e nei vari progetti AI locali e per chi vuole, da verificare.
Proteo7111 Maggio 2026, 18:27 #4
Originariamente inviato da: r1348
Va beh, hanno confrontato una GPU nata per il machine learning in datacenter con delle GPU gaming di fascia medio-bassa.
Anche oggi il premio "grazie al c...o" è stato assegnato.


Originariamente inviato da: OrazioOC
Livello dell'articolo: WCCFtech.


Che importa del contenuto...
l'importante è poter pubblicare un ennesimo articolo in più che contenga le due lettere magiche nel titolo.
Come se non ce ne fossero già troppi !!
Deltaweb7312 Maggio 2026, 05:42 #5

articolo molto interessante

Il mondo per fortuna e' bello perche' vario. L'articolo e la news la trovo molto intrigante.
Per esempio uso con soddisfazione una gtx1080ti proprio per openclaw e riutilizzare vecchio hw per progetti personali/di lavoro a una frazione del costo di schede moderne o sfruttare Soc economici per progetti analoghi lo trovo molto interessante.
Chiaramente tutto imho

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^