DeepSeek svela i dettagli tecnici di R1, il modello AI cinese che ha sorpreso tutti e che costa meno
DeepSeek pubblica dettagli sul modello R1, un LLM economico e performante in matematica e coding, addestrato con tecniche di reinforcement learning senza copiare altri sistemi, a detta dell'azienda cinese. Il documento peer-reviewed svela costi, hardware e metodo di training alla base del suo successo globale
di Rosario Grasso pubblicata il 19 Settembre 2025, alle 12:31 nel canale AppleDeepSeek
DeepSeek è il modello di intelligenza artificiale che a gennaio ha scosso il mercato azionario statunitense. Pubblicato questa settimana su Nature, uno studio peer-reviewed mostra come il modello sia stato sviluppato con un investimento di appena 294.000 dollari, oltre ai circa 6 milioni spesi per il modello base. Questo lo rende molto più economico rispetto ai modelli concorrenti sviluppati negli Stati Uniti.
R1 si distingue per le capacità di ragionamento matematico e programmazione. Il training non ha previsto la copia di esempi generati da altri LLM, ma si è basato su una forma automatizzata di reinforcement learning che premia le risposte corrette invece di insegnare strategie predefinite. Il modello valuta autonomamente i propri tentativi tramite stime interne e usa una tecnica nota come group relative policy optimization. Queste puntualizzazioni si sono rese necessarie perché inizialmente DeepSeek è stata accusata di attingere a dati dei modelli di OpenAI.
La revisione peer-reviewed ha portato alla chiarificazione dei dati usati nel training con l'obiettivo di aumentare la trasparenza e l'affidabilità scientifica del modello. Esperti sottolineano che la metodologia di DeepSeek rappresenta un punto di riferimento per chi sviluppa LLM orientati al ragionamento.
Il team di Hangzhou ha addestrato R1 principalmente con GPU Nvidia H800, nonostante le restrizioni commerciali imposte dagli Stati Uniti alla vendita di queste schede alle società cinesi nel 2023. Come modello open weight, R1 è scaricabile da chiunque e ha superato 10,9 milioni di download sulla piattaforma Hugging Face.
Nonostante non abbia raggiunto la massima accuratezza in test scientifici come ScienceAgentBench, R1 si conferma tra i modelli più efficienti in termini di rapporto tra prestazioni e costi. Ricercatori internazionali stanno ora studiando come applicare le tecniche di R1 per migliorare le capacità di ragionamento di altri LLM e per espandere l'approccio a nuovi domini oltre matematica e coding.
Secondo gli esperti, R1 ha avviato un cambiamento nelle pratiche di addestramento degli LLM e sta dimostrando che è possibile ottenere alte prestazioni senza dipendere dai contenuti generati da altri sistemi AI. La combinazione di basso costo, capacità di ragionamento e accessibilità open weight rende R1 uno dei modelli più determinanti del 2025.










Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Renault Twingo E-Tech Electric: che prezzo!
Smart home più facile ed economica: arrivano 21 dispositivi IKEA compatibili Matter
Motorola edge 50 neo in svendita, 202€: fotocamera 50MPixel OIS, tele 3X ottico 3X OIS, tanta sostanza
Cina e Paesi Bassi verso la distensione sul caso Nexperia: riprendono le esportazioni di chip per uso civile
'Senza TSMC non ci sarebbe NVIDIA': Jensen Huang prima loda, poi pretende. E mette in guardia Musk
Fumo di sigaretta e sporco per 17 anni: da relitto tossico a gioiello da collezione, così è rinata questa 9800 GT
Resi Amazon Natale 2025: cambiano i tempi di reso per alcune categorie di prodotti
L'SSD modulare aggiornabile come un PC: l'innovazione marchiata Samsung
Intel ha denunciato un ex dipendente per furto di 18.000 file classificati 'Top Secret'
Blue Origin rinvia il secondo lancio del razzo New Glenn per problemi meteo e una nave da crociera
Nasce l'albo degli influencer 'rilevanti' in Italia: AGCOM ha aperto le iscrizioni
Il Digital Networks Act è stato rimandato: troppi aspetti ancora da chiarire
ASUS ROG ha lanciato due nuovi monitor da gaming con pannello Tandem OLED da 27 pollici
I nuovi iPhone 18 Pro potrebbero presentare un design inedito (per Apple)
Una parte dei Galaxy S26 avrà chip Exynos: la conferma arriva da Qualcomm









4 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info" che premia le risposte corrette"
E chi decide quali sono le risposte corrette?Quelle che l'utente non contesta con una interrogazione successiva?.....
Quelle che l'utente non contesta con una interrogazione successiva?.....
Il governo USA che sì sà essere innocente e puro.
Minkiate a parte non esistono le domande di carattere politico, ma buona parte sono di carattere tecnico e culturale.
Deepseek consente l'accesso ad algoritmi complessi ad un costo molto inferiore a Chatgpt.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".