DeepSeek svela i dettagli tecnici di R1, il modello AI cinese che ha sorpreso tutti e che costa meno

DeepSeek svela i dettagli tecnici di R1, il modello AI cinese che ha sorpreso tutti e che costa meno

DeepSeek pubblica dettagli sul modello R1, un LLM economico e performante in matematica e coding, addestrato con tecniche di reinforcement learning senza copiare altri sistemi, a detta dell'azienda cinese. Il documento peer-reviewed svela costi, hardware e metodo di training alla base del suo successo globale

di pubblicata il , alle 12:31 nel canale Apple
DeepSeek
 

DeepSeek è il modello di intelligenza artificiale che a gennaio ha scosso il mercato azionario statunitense. Pubblicato questa settimana su Nature, uno studio peer-reviewed mostra come il modello sia stato sviluppato con un investimento di appena 294.000 dollari, oltre ai circa 6 milioni spesi per il modello base. Questo lo rende molto più economico rispetto ai modelli concorrenti sviluppati negli Stati Uniti.

R1 si distingue per le capacità di ragionamento matematico e programmazione. Il training non ha previsto la copia di esempi generati da altri LLM, ma si è basato su una forma automatizzata di reinforcement learning che premia le risposte corrette invece di insegnare strategie predefinite. Il modello valuta autonomamente i propri tentativi tramite stime interne e usa una tecnica nota come group relative policy optimization. Queste puntualizzazioni si sono rese necessarie perché inizialmente DeepSeek è stata accusata di attingere a dati dei modelli di OpenAI.

La revisione peer-reviewed ha portato alla chiarificazione dei dati usati nel training con l'obiettivo di aumentare la trasparenza e l'affidabilità scientifica del modello. Esperti sottolineano che la metodologia di DeepSeek rappresenta un punto di riferimento per chi sviluppa LLM orientati al ragionamento.

NVIDIA DeepSeek server

Il team di Hangzhou ha addestrato R1 principalmente con GPU Nvidia H800, nonostante le restrizioni commerciali imposte dagli Stati Uniti alla vendita di queste schede alle società cinesi nel 2023. Come modello open weight, R1 è scaricabile da chiunque e ha superato 10,9 milioni di download sulla piattaforma Hugging Face.

Nonostante non abbia raggiunto la massima accuratezza in test scientifici come ScienceAgentBench, R1 si conferma tra i modelli più efficienti in termini di rapporto tra prestazioni e costi. Ricercatori internazionali stanno ora studiando come applicare le tecniche di R1 per migliorare le capacità di ragionamento di altri LLM e per espandere l'approccio a nuovi domini oltre matematica e coding.

Secondo gli esperti, R1 ha avviato un cambiamento nelle pratiche di addestramento degli LLM e sta dimostrando che è possibile ottenere alte prestazioni senza dipendere dai contenuti generati da altri sistemi AI. La combinazione di basso costo, capacità di ragionamento e accessibilità open weight rende R1 uno dei modelli più determinanti del 2025.

4 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
giovanni6919 Settembre 2025, 13:25 #1

" che premia le risposte corrette"

E chi decide quali sono le risposte corrette?

Quelle che l'utente non contesta con una interrogazione successiva?.....
hackaro7519 Settembre 2025, 13:32 #2
ecco perché c'è stato il crollo di Wall Street!!!
Ripper8919 Settembre 2025, 13:40 #3
Originariamente inviato da: giovanni69
E chi decide quali sono le risposte corrette?

Quelle che l'utente non contesta con una interrogazione successiva?.....
E chi decide quali sono le risposte corrette su Chatgpt, gemini e groc ?
Il governo USA che sì sà essere innocente e puro.

Minkiate a parte non esistono le domande di carattere politico, ma buona parte sono di carattere tecnico e culturale.
Deepseek consente l'accesso ad algoritmi complessi ad un costo molto inferiore a Chatgpt.
Matteo239825 Settembre 2025, 06:13 #4
Le risposte corrette sono determinate automaticamente, dato che si parla di task di matematica e coding. È proprio questo il motivo per cui sono stati scelti questi due domini.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^