DeepSeek svela i dettagli tecnici di R1, il modello AI cinese che ha sorpreso tutti e che costa meno

DeepSeek pubblica dettagli sul modello R1, un LLM economico e performante in matematica e coding, addestrato con tecniche di reinforcement learning senza copiare altri sistemi, a detta dell'azienda cinese. Il documento peer-reviewed svela costi, hardware e metodo di training alla base del suo successo globale

di Rosario Grasso pubblicata il 19 Settembre 2025, alle 12:31 nel canale Apple
DeepSeek

DeepSeek è il modello di intelligenza artificiale che a gennaio ha scosso il mercato azionario statunitense. Pubblicato questa settimana su Nature, uno studio peer-reviewed mostra come il modello sia stato sviluppato con un investimento di appena 294.000 dollari, oltre ai circa 6 milioni spesi per il modello base. Questo lo rende molto più economico rispetto ai modelli concorrenti sviluppati negli Stati Uniti.

R1 si distingue per le capacità di ragionamento matematico e programmazione. Il training non ha previsto la copia di esempi generati da altri LLM, ma si è basato su una forma automatizzata di reinforcement learning che premia le risposte corrette invece di insegnare strategie predefinite. Il modello valuta autonomamente i propri tentativi tramite stime interne e usa una tecnica nota come group relative policy optimization. Queste puntualizzazioni si sono rese necessarie perché inizialmente DeepSeek è stata accusata di attingere a dati dei modelli di OpenAI.

La revisione peer-reviewed ha portato alla chiarificazione dei dati usati nel training con l'obiettivo di aumentare la trasparenza e l'affidabilità scientifica del modello. Esperti sottolineano che la metodologia di DeepSeek rappresenta un punto di riferimento per chi sviluppa LLM orientati al ragionamento.

NVIDIA DeepSeek server

Il team di Hangzhou ha addestrato R1 principalmente con GPU Nvidia H800, nonostante le restrizioni commerciali imposte dagli Stati Uniti alla vendita di queste schede alle società cinesi nel 2023. Come modello open weight, R1 è scaricabile da chiunque e ha superato 10,9 milioni di download sulla piattaforma Hugging Face.

Nonostante non abbia raggiunto la massima accuratezza in test scientifici come ScienceAgentBench, R1 si conferma tra i modelli più efficienti in termini di rapporto tra prestazioni e costi. Ricercatori internazionali stanno ora studiando come applicare le tecniche di R1 per migliorare le capacità di ragionamento di altri LLM e per espandere l'approccio a nuovi domini oltre matematica e coding.

Secondo gli esperti, R1 ha avviato un cambiamento nelle pratiche di addestramento degli LLM e sta dimostrando che è possibile ottenere alte prestazioni senza dipendere dai contenuti generati da altri sistemi AI. La combinazione di basso costo, capacità di ragionamento e accessibilità open weight rende R1 uno dei modelli più determinanti del 2025.

I migliori sconti su Amazon oggi

-35%

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

95.99 61.99€ Compra ora

-35%

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

-35%

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

44.38€ Compra ora

Nothing Ear (3) ufficiali: hanno un Super Mic nella custodia per migliorare le chiamate

FAN APP Ferrari: l'IA di IBM al servizio della scuderia del cavallino

giovanni6919 Settembre 2025, 13:25 #1

" che premia le risposte corrette"

E chi decide quali sono le risposte corrette?

Quelle che l'utente non contesta con una interrogazione successiva?.....

hackaro7519 Settembre 2025, 13:32 #2

ecco perché c'è stato il crollo di Wall Street!!!

Ripper8919 Settembre 2025, 13:40 #3

Originariamente inviato da: giovanni69

E chi decide quali sono le risposte corrette?

Quelle che l'utente non contesta con una interrogazione successiva?.....

E chi decide quali sono le risposte corrette su Chatgpt, gemini e groc ?
Il governo USA che sì sà essere innocente e puro.

Minkiate a parte non esistono le domande di carattere politico, ma buona parte sono di carattere tecnico e culturale.
Deepseek consente l'accesso ad algoritmi complessi ad un costo molto inferiore a Chatgpt.

Matteo239825 Settembre 2025, 06:13 #4

Le risposte corrette sono determinate automaticamente, dato che si parla di task di matematica e coding. È proprio questo il motivo per cui sono stati scelti questi due domini.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

ASUS ROG CROSSHAIR X870E GLACIAL

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

DeepSeek svela i dettagli tecnici di R1, il modello AI cinese che ha sorpreso tutti e che costa meno

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

4 Commenti