DeepSeek fa saltare il banco: V4 Pro a un quarto del prezzo, la concorrenza USA sotto pressione
Il laboratorio di Hangzhou rende definitivo il taglio del 75% sul modello di punta V4 Pro: prezzi a un quarto rispetto al lancio di aprile, con output a 0,87 dollari per milione di token contro i 25 di Claude Opus 4.7
di Andrea Bai pubblicata il 25 Maggio 2026, alle 09:21 nel canale Scienza e tecnologiaDeepSeek
Nei giorni scorsi DeepSeek ha reso permanente la riduzione del 75% sui prezzi del modello di punta V4 Pro. La promozione, originariamente in scadenza il 31 maggio 2026, diventa ora la nuova tariffa di listino a regime: il laboratorio cinese ha fissato il prezzo delle API del V4 Pro tra 0,003625 e 0,87 dollari per milione di token, contro i precedenti 0,0145 e 3,48 dollari. Il taglio si applica a tutte le fasce ma si concentra in particolare sulle componenti di input con cache hit, dove il costo scende a circa un decimo del prezzo originario, secondo la pagina ufficiale dei prezzi.
La decisione arriva poco più di un mese dopo il lancio della famiglia V4, avvenuto il 24 aprile e composto dalle varianti Pro (1,6 trilioni di parametri totali in architettura Mixture-of-Experts, con 49 miliardi attivi per inferenza) e Flash (284 miliardi). Entrambe le versioni supportano un contesto da un milione di token e un output massimo di 384.000 token per singola richiesta, sotto licenza MIT. Al lancio, DeepSeek aveva definito la mossa come l'apertura dell'"era del contesto da 1M token a basso costo", una posizione che ora diventa ancor più vera dopo la decisione di taglio permanente.
La fornitura Huawei Ascend resta il convitato di pietra
Già al lancio di aprile DeepSeek aveva indicato che il prezzo del Pro sarebbe sceso significativamente una volta che i supernode Huawei Ascend 950 sarebbero duvenuti disponibili in volumi significativi, condizione attesa per la seconda metà del 2026. Le specifiche del Pro, fino a 12 volte più costoso del Flash al momento del rilascio, erano state giustificate proprio con i "vincoli di capacità di calcolo di fascia alta".

Il legame con l'infrastruttura cinese è strategico oltre che economico. La famiglia V4 è stata adattata «day zero» per Ascend 950 e DeepSeek non ha concesso accesso anticipato a NVIDIA e AMD durante la finestra di ottimizzazione pre-lancio, un'inversione rispetto alla prassi consolidata del settore. Lo sconto permanente potrebbe in qualche modo riflettere un miglioramento sul lato dei costi di inferenza derivante dall'ecosistema hardware domestico, anche se al momento il laboratorio non ha rilasciato alcuna dichiarazione in tal senso.
Il distacco con i rivali occidentali si allarga
I nuovi prezzi del V4 Pro lo collocano nella fascia bassa del mercato dei modelli di frontiera. Claude Opus 4.7 di Anthropic costa 5 dollari per milione di token in input e 25 in output; OpenAI GPT-5 parte da 2,50 dollari input e 10 dollari output. Sull'output, V4 Pro a 0,87 dollari è circa 28 volte più economico di Claude Opus 4.7 e 11 volte più di GPT-5. Il distacco si amplia nei workload con cache hit elevato, dove il prezzo dell'input scende a 0,003625 dollari per milione di token, scenario tipico degli agenti AI con prompt ripetitivi su sessioni prolungate. Solo Google Gemini 3.5 Flash, il modello a basso costo di Mountain View, resta più conveniente in valore assoluto con 0,15 dollari input e 0,60 output, pur posizionandosi su un tier di prestazioni e finalità distinto.
Immaginando di applicare i nuovi prezzi a carichi di lavoro enterprise, il vantaggio sarebbe significativo. Salesforce, ad esempio, ha elaborato proiezioni per 300 milioni di dollari di spesa annuale in token Anthropic per il 2026. A parità di volume di token, applicando i nuovi listini DeepSeek, quella stessa spesa scenderebbe nell'ordine dei 20-30 milioni di dollari, tra un decimo e un quindicesimo del totale, a seconda del mix tra input, output e cache hit. Il vantaggio si scontra però con i rischi di compliance e geopolitica nel far transitare workload sensibili attraverso un fornitore cinese, in un contesto in cui Anthropic ha accusato DeepSeek di distillation attack lo scorso febbraio.
Il listino aggiornato è già visibile sulla pagina API del laboratorio cinese. La verifica sul piano dei volumi enterprise arriverà nei prossimi trimestri, mentre i tempi di disponibilità in volume dei supernode Huawei Ascend 950 nella seconda metà del 2026 resta la variabile da osservare per misurare la sostenibilità del taglio.









Recensione realme 16 5G: lo smartphone con Selfie Mirror ha una batteria da 6550mAh
Come rispettare tutte le nuove regole per i monopattini elettrici? La guida per non rischiare sanzioni
DLSS 4.5: con Dynamic Frame Generation e MFG 6X NVIDIA alza la posta
Italian Video Game Awards: ecco la lista dei vincitori delle singole categorie
Edits: l'app di Meta per i Reels diventa più potente con AI assistant, desktop e A/B test in un solo aggiornamento
Oggi su Amazon il misuratore di pressione arteriosa OMRON X2 Essential costa 24,99€, praticamente regalato
Con iOS 27 l'app Passwords diventa agentica: cambia le password compromesse senza intervento manuale
Apple AirPods Pro 3 arrivano a 199€: il modello di punta con cancellazione del rumore al top e rilevamento della frequenza cardiaca
NVIDIA è ancora imbattibile: 9 schede video su 10 vendute portano il suo marchio
La nuova Dodge Charger arriva in Italia: elettrica o termica, sempre con potenza da vendere
Anthropic propone regole per bloccare i modelli AI pericolosi e ammette l'errore su Fable 5
Basta imitazioni: Secretlab adotta la linea dura contro chi copia le sue iconiche sedie da gaming
Il calcio non ha più segreti: l'IA di Google prevede l'azione 8 secondi prima che accada
Coinbase for Agents: ChatGPT e Claude possono ora fare trading di criptovalute
Reddit lancia i video nei commenti: ecco come funzionano e chi può usarli davvero
Google 'Icefish': le TPU di prossima generazione guardano al processo a 2 nanometri di Samsung?
DREAME D10 Plus Gen 2 torna in offerta su Amazon: 6.000Pa, svuotamento automatico e lavaggio 2 in 1, super economico a 152,57€









6 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoOvvio che "proietti" quei costi se ai programmatori dici che vengono valutati sulla quantità di token usati invece della qualità di codice generato.
La legge di Goodhart è un principio socio-economico che recita: «Nel momento in cui una misura diviene un obiettivo, cessa di essere una buona misura»
Io alla fine deepseek lo lasciato perchè non generava un granchè bene.
Ieri ho visto un video comparativo su youtube dei modelli cinesi, ma deepseek v4 non era nella lista, stavano provando QWEN 3.7, era più economico ma il codice generato era troppo spesso con errori e quindi in un agente era costretto a riprovare e riprovare consumando token.
Alla fine sono risultati più economici GPT 5.5 e Claude 4.7 perchè generavano a primo colpo codice compilabile e funzionante.
Il discorso cambia se questi modelli open source si possono far girare in locale, per DP v4 è diventato impossibile, forse la versione flash con AMD Ryzen 395 e 128GB di RAM.
Gli compriamo il gas al quadruplo del prezzo, pagheremo quindi sia Cloud che OpenAI a quattro volte il costo di DeepSeek.
Dove è il problema ?
è già gratis, la versione flash e pro di DP v4 è liberamente scaricabile da huggingface, il problema che non basta un semplice PC con GPU potente per farlo girare.
La versione flash forse ci si riesce con AMD Ryzen 395 e 128GB, è da valutare.
Io volevo comprarlo prima dell'inizio della crisi, ora è il costo è proibitivo.
i complottismi li lascio ad altri, io ho smesso di usare DP perchè poi alla fine ci si perdeva molto tempo a far funzionare quello che generava. Gemini è di gran lunga meglio.
Io leggo ben altri numeri?
gemini-3.5-flash
Prezzo di input: 1,50 $
Prezzo di output (inclusi i token di pensiero): $ 9,00
Prezzo della memorizzazione nella cache del contesto: $0,15 - $1,00 / 1.000.000 di token all'ora (prezzo di archiviazione)
E poi c'è una cosa che mi stuzzica: ci viene detto "la Cina ci spia".
Sì, ma credete che Google, Facebook & c non ci spiino?
A conti fatti, se mi mettessi le dita nel naso, preferirei un cinese che mi spia e che è lontano 10000 km e che non può dirlo a nessuno che conosco, piuttosto che mi spii il vicino di casa e lo dica a tutto il paese in cui vivo
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".