DeepSeek fa saltare il banco: V4 Pro a un quarto del prezzo, la concorrenza USA sotto pressione

DeepSeek fa saltare il banco: V4 Pro a un quarto del prezzo, la concorrenza USA sotto pressione

Il laboratorio di Hangzhou rende definitivo il taglio del 75% sul modello di punta V4 Pro: prezzi a un quarto rispetto al lancio di aprile, con output a 0,87 dollari per milione di token contro i 25 di Claude Opus 4.7

di pubblicata il , alle 09:21 nel canale Scienza e tecnologia
DeepSeek
 

Nei giorni scorsi DeepSeek ha reso permanente la riduzione del 75% sui prezzi del modello di punta V4 Pro. La promozione, originariamente in scadenza il 31 maggio 2026, diventa ora la nuova tariffa di listino a regime: il laboratorio cinese ha fissato il prezzo delle API del V4 Pro tra 0,003625 e 0,87 dollari per milione di token, contro i precedenti 0,0145 e 3,48 dollari. Il taglio si applica a tutte le fasce ma si concentra in particolare sulle componenti di input con cache hit, dove il costo scende a circa un decimo del prezzo originario, secondo la pagina ufficiale dei prezzi.

La decisione arriva poco più di un mese dopo il lancio della famiglia V4, avvenuto il 24 aprile e composto dalle varianti Pro (1,6 trilioni di parametri totali in architettura Mixture-of-Experts, con 49 miliardi attivi per inferenza) e Flash (284 miliardi). Entrambe le versioni supportano un contesto da un milione di token e un output massimo di 384.000 token per singola richiesta, sotto licenza MIT. Al lancio, DeepSeek aveva definito la mossa come l'apertura dell'"era del contesto da 1M token a basso costo", una posizione che ora diventa ancor più vera dopo la decisione di taglio permanente.

La fornitura Huawei Ascend resta il convitato di pietra

Già al lancio di aprile DeepSeek aveva indicato che il prezzo del Pro sarebbe sceso significativamente una volta che i supernode Huawei Ascend 950 sarebbero duvenuti disponibili in volumi significativi, condizione attesa per la seconda metà del 2026. Le specifiche del Pro, fino a 12 volte più costoso del Flash al momento del rilascio, erano state giustificate proprio con i "vincoli di capacità di calcolo di fascia alta".

Il legame con l'infrastruttura cinese è strategico oltre che economico. La famiglia V4 è stata adattata «day zero» per Ascend 950 e DeepSeek non ha concesso accesso anticipato a NVIDIA e AMD durante la finestra di ottimizzazione pre-lancio, un'inversione rispetto alla prassi consolidata del settore. Lo sconto permanente potrebbe in qualche modo riflettere un miglioramento sul lato dei costi di inferenza derivante dall'ecosistema hardware domestico, anche se al momento il laboratorio non ha rilasciato alcuna dichiarazione in tal senso.

Il distacco con i rivali occidentali si allarga

I nuovi prezzi del V4 Pro lo collocano nella fascia bassa del mercato dei modelli di frontiera. Claude Opus 4.7 di Anthropic costa 5 dollari per milione di token in input e 25 in output; OpenAI GPT-5 parte da 2,50 dollari input e 10 dollari output. Sull'output, V4 Pro a 0,87 dollari è circa 28 volte più economico di Claude Opus 4.7 e 11 volte più di GPT-5. Il distacco si amplia nei workload con cache hit elevato, dove il prezzo dell'input scende a 0,003625 dollari per milione di token, scenario tipico degli agenti AI con prompt ripetitivi su sessioni prolungate. Solo Google Gemini 3.5 Flash, il modello a basso costo di Mountain View, resta più conveniente in valore assoluto con 0,15 dollari input e 0,60 output, pur posizionandosi su un tier di prestazioni e finalità distinto.

Immaginando di applicare i nuovi prezzi a carichi di lavoro enterprise, il vantaggio sarebbe significativo. Salesforce, ad esempio, ha elaborato proiezioni per 300 milioni di dollari di spesa annuale in token Anthropic per il 2026. A parità di volume di token, applicando i nuovi listini DeepSeek, quella stessa spesa scenderebbe nell'ordine dei 20-30 milioni di dollari, tra un decimo e un quindicesimo del totale, a seconda del mix tra input, output e cache hit. Il vantaggio si scontra però con i rischi di compliance e geopolitica nel far transitare workload sensibili attraverso un fornitore cinese, in un contesto in cui Anthropic ha accusato DeepSeek di distillation attack lo scorso febbraio.

Il listino aggiornato è già visibile sulla pagina API del laboratorio cinese. La verifica sul piano dei volumi enterprise arriverà nei prossimi trimestri, mentre i tempi di disponibilità in volume dei supernode Huawei Ascend 950 nella seconda metà del 2026 resta la variabile da osservare per misurare la sostenibilità del taglio.

6 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Portocala25 Maggio 2026, 10:07 #1
Salesforce, ad esempio, ha elaborato proiezioni per 300 milioni di dollari di spesa annuale in token Anthropic per il 2026

Ovvio che "proietti" quei costi se ai programmatori dici che vengono valutati sulla quantità di token usati invece della qualità di codice generato.

La legge di Goodhart è un principio socio-economico che recita: «Nel momento in cui una misura diviene un obiettivo, cessa di essere una buona misura»
lumeruz25 Maggio 2026, 12:11 #2
penso che oltre il prezzo bisogna valutare la precisione di questi modelli.
Io alla fine deepseek lo lasciato perchè non generava un granchè bene.
Ieri ho visto un video comparativo su youtube dei modelli cinesi, ma deepseek v4 non era nella lista, stavano provando QWEN 3.7, era più economico ma il codice generato era troppo spesso con errori e quindi in un agente era costretto a riprovare e riprovare consumando token.
Alla fine sono risultati più economici GPT 5.5 e Claude 4.7 perchè generavano a primo colpo codice compilabile e funzionante.
Il discorso cambia se questi modelli open source si possono far girare in locale, per DP v4 è diventato impossibile, forse la versione flash con AMD Ryzen 395 e 128GB di RAM.
Ripper8925 Maggio 2026, 12:13 #3
Possono anche darlo via gratis ma le realtà occidentali non lo adotteranno mai in massa, i padroni USA ce lo vietano.
Gli compriamo il gas al quadruplo del prezzo, pagheremo quindi sia Cloud che OpenAI a quattro volte il costo di DeepSeek.
Dove è il problema ?
lumeruz25 Maggio 2026, 12:16 #4
Originariamente inviato da: Ripper89
Possono anche darlo via gratis

è già gratis, la versione flash e pro di DP v4 è liberamente scaricabile da huggingface, il problema che non basta un semplice PC con GPU potente per farlo girare.
La versione flash forse ci si riesce con AMD Ryzen 395 e 128GB, è da valutare.
Io volevo comprarlo prima dell'inizio della crisi, ora è il costo è proibitivo.

Originariamente inviato da: Ripper89
ma le realtà occidentali non lo adotteranno mai in massa, i padroni USA ce lo vietano.

i complottismi li lascio ad altri, io ho smesso di usare DP perchè poi alla fine ci si perdeva molto tempo a far funzionare quello che generava. Gemini è di gran lunga meglio.
Ibanez8925 Maggio 2026, 12:23 #5
Solo Google Gemini 3.5 Flash, il modello a basso costo di Mountain View, resta più conveniente in valore assoluto con 0,15 dollari input e 0,60 output


Io leggo ben altri numeri?

gemini-3.5-flash
Prezzo di input: 1,50 $
Prezzo di output (inclusi i token di pensiero): $ 9,00
Prezzo della memorizzazione nella cache del contesto: $0,15 - $1,00 / 1.000.000 di token all'ora (prezzo di archiviazione)
NeroCupo25 Maggio 2026, 13:02 #6
Io con DeepSeek mi trovo benone

E poi c'è una cosa che mi stuzzica: ci viene detto "la Cina ci spia".
Sì, ma credete che Google, Facebook & c non ci spiino?
A conti fatti, se mi mettessi le dita nel naso, preferirei un cinese che mi spia e che è lontano 10000 km e che non può dirlo a nessuno che conosco, piuttosto che mi spii il vicino di casa e lo dica a tutto il paese in cui vivo

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^