Chi è Liang Wenfeng: il 'nerd dall'acconciatura terribile' che ha creato DeepSeek (e messo in ginocchio l'industria IA)

Chi è Liang Wenfeng: il 'nerd dall'acconciatura terribile' che ha creato DeepSeek (e messo in ginocchio l'industria IA)

Liang Wenfeng, un imprenditore cinese di 40 anni, ha scosso le fondamenta del settore dell'intelligenza artificiale con la sua startup DeepSeek, sfidando i colossi americani e attirando l'attenzione globale. La sua storia è quella dell'ennesimo nerd tanto sottovalutato quanto ambizioso.

di pubblicata il , alle 15:41 nel canale Web
DeepSeek
 

L'intelligenza artificiale è da tempo, ormai, l'argomento più in voga per gli appassionati di tecnologia. E, per chi se lo fosse perso in questi giorni, un nuovo attore ha fatto il suo ingresso trionfale scuotendo le fondamenta del mercato e mettendo in discussione il dominio delle grandi aziende tecnologiche occidentali. Si parla ovviamente di DeepSeek, una startup cinese fondata in realtà nel 2023, che ha rapidamente conquistato l'attenzione con il rilascio del suo ultimo modello di intelligenza artificiale open source.

Ciò che rende notevole DeepSeek-R1, cioè il più recente LLM dell'azienda, è la sua capacità di raggiungere risultati paragonabili ai giganti del settore con una frazione dei costi e delle risorse, e i primi test compiuti dagli osservatori non danno torto ai comunicati. L'azienda sostiene di aver sviluppato il suo modello spendendo solo una piccola porzione del costo della maggior parte dei concorrenti statunitensi, un fatto che ha scosso i produttori di chip americani e tutte le aziende focalizzate sull'IA, soprattutto quelle alla ricerca di capitali da parte di investitori interessati, prima o poi, a fare margine.

Ma chi c'è alla base di DeepSeek?

Ad aver fondato DeepSeek nel 2023 è stato Liang Wenfeng. La sua figura emerge oggi in un contesto in cui la Cina sta cercando di affermarsi come leader nel campo dell'intelligenza artificiale. Cresciuto nel Guangdong, Wenfeng ha sempre mostrato una spiccata curiosità per la tecnologia, sviluppando competenze in ingegneria dell'informazione e comunicazione presso l'Università di Zhejiang.

La sua carriera professionale ha avuto inizio nel mondo della finanza, in cui ha co-fondato High-Flyer, un hedge fund quantitativo che punta a usare l'intelligenza artificiale per creare le sue strategie di investimento. Nel 2017 la startup di Wenfeng poteva contare su algoritmi di intelligenza artificiale per sviluppare, in pratica, quasi tutte le sue posizioni azionarie, mentre nel 2021 l'imprenditore ha iniziato ad accumulare GPU NVIDIA per un progetto IA non meglio identificato, in fortunoso anticipo rispetto alle restrizioni di Biden (2022) che avrebbero impedito alle realtà cinesi di utilizzare quei chip. Due anni più tardi nasceva DeepSeek, con cui Liang riuscirà a farsi notare davvero. Con la nuova realtà, l'idea di Liang era chiara fin dal principio: creare un'intelligenza artificiale accessibile e potente, capace di competere con i modelli delle grandi aziende statunitensi come OpenAI e Google. Con un capitale iniziale relativamente modesto di 1,4 milioni di dollari, Wenfeng punta a sviluppare un modello open source che possa essere scaricato e utilizzato da chiunque: "Non vogliamo semplicemente costruire un modello", afferma. "Vogliamo ridefinire le regole dell'innovazione".

Il lancio del modello R1 di DeepSeek ha avuto un impatto immediato sul mercato. In poche ore dalla sua disponibilità, l'app è diventata la più scaricata negli Stati Uniti, superando anche ChatGPT. Questo successo ha scatenato reazioni a catena nei mercati finanziari, con le azioni delle aziende tecnologiche americane che hanno subito un crollo significativo. Il valore di NVIDIA, in particolare, è diminuito drasticamente, evidenziando un'incredibile vulnerabilità (temporanea?) dei colossi tecnologici rispetto a un concorrente emergente come DeepSeek. In breve, DeepSeek-R1 si è fatto notare per i seguenti punti:

  • La creazione del modello R1 ha richiesto un approccio innovativo all'addestramento, ottimizzando l'uso delle risorse disponibili. DeepSeek ha dovuto affrontare la difficoltà di utilizzare chip NVIDIA limitati a causa delle restrizioni statunitensi, fattore che ha portato il team a rielaborare il processo di addestramento, riducendo il carico sulle GPU e consentendo di ottenere risultati comparabili ai concorrenti con un numero significativamente inferiore di chip.
  • L'azienda si è concentrata, allo stesso modo, nella riduzione dei costi. DeepSeek ha dichiarato di aver sviluppato il suo modello per meno di 6 milioni di dollari, un costo notevolmente inferiore rispetto ai 100 milioni o più spesi da altre aziende per modelli simili. Questa strategia ha non solo reso DeepSeek competitiva, ma ha anche messo in discussione l'intero modello economico delle aziende IA statunitensi.
  • La decisione di rendere DeepSeek open source ha rappresentato un passo estremamente audace, soprattutto in un ambito in cui possedere le ultime innovazioni può essere determinante. L'approccio coraggioso ha permesso a oltre 200 mila sviluppatori di integrare la tecnologia in una varietà di applicazioni, accelerando l'adozione e la diffusione del modello. Tuttavia, questa scelta ha anche sollevato preoccupazioni riguardo alla gestione dei dati, poiché risposte a domande sensibili vengono filtrate per allinearsi con la narrativa del governo cinese.
  • L'impatto immediato del lancio di DeepSeek-R1 ha generato reazioni forti nel mercato tecnologico globale, provocando perdite significative nel Nasdaq e mettendo in discussione la supremazia degli Stati Uniti nel settore dell'IA. Le reazioni negative da parte delle aziende americane e le indagini sui potenziali problemi legati alla privacy hanno ulteriormente complicato il contesto in cui DeepSeek si è affermata.

L'ennesimo "nerd" sottovalutato

Liang Wenfeng, oggi quarantenne, viene descritto dalla stampa internazionale come un "nerd" con la passione della matematica e il pallino dell'intelligenza artificiale. Quando parlava delle sue ambizioni, con il piano di accumulare migliaia di GPU NVIDIA per costruire un sistema di calcolo, non veniva neanche capito: "Non riusciva ad articolare la sua visione se non dicendo: voglio costruire questa roba, perché cambierà il mondo".

L'uomo che ha messo in ginocchio un intero settore e tutta la sua narrativa viene descritto così da uno dei suoi soci in affari, così come dichiarato al Financial Times:

"Quando l'abbiamo incontrato per la prima volta, era un tipo molto nerd con un'acconciatura terribile che parlava di costruire un cluster da 10.000 chip per addestrare i suoi modelli.

Impossibile prenderlo sul serio".

Wenfeng è cresciuto in una famiglia normale: i suoi genitori erano insegnanti di scuola elementare e hanno instillato in lui l'importanza dell'istruzione e della curiosità intellettuale. Fin da giovane, ha dimostrato una passione per la matematica e la tecnologia, bilanciando "lavoro e riposo" grazie anche alla capacità di "imparare bene ogni materia senza passare molto tempo a studiare". Prima di High-Flyer ha fondato Jacobi, anch'essa una società di investimenti che prendeva il nome dal matematico tedesco Carl Jacobi. Il resto della sua storia lo abbiamo già raccontato poco sopra.

Il successo contro ogni previsione

Il successo di DeepSeek non è solo il risultato delle capacità tecniche di Wenfeng e del suo team, ma è probabilmente anche il frutto di una strategia ben pianificata. Con l'imposizione delle restrizioni statunitensi sull'accesso ai chip avanzati, l'imprenditore ha dovuto adattarsi rapidamente alle nuove circostanze cercando di trovare modi creativi per utilizzare risorse disponibili in Cina per costruire il suo modello IA. DeepSeek ha dimostrato, praticamente per la prima volta nel settore, che è possibile ottenere risultati di ottimo livello anche con budget limitati.

Pensare che quello di Wenfeng sia solo un prodotto innovativo sarebbe comunque un errore: DeepSeek è riuscita a creare movimento attorno all'idea che la Cina possa essere all'avanguardia nell'IA senza dover necessariamente seguire le orme degli Stati Uniti. La sua visione include la configurazione di una comunità attraverso un approccio open source, dove gli sviluppatori possono contribuire e migliorare continuamente la piattaforma. Se dal nostro punto di vista, possono emergere preoccupazioni sulla crescente competitività della Cina nel campo dell'IA, dall'altra parte la storia personale di Wenfeng rappresenta simbolicamente una sfida all'egemonia tecnologica occidentale, e soprattutto degli Stati Uniti.

Al momento in cui scriviamo, tuttavia, Wenfeng sembra determinato a mantenere un profilo relativamente basso mentre guida l'inaspettato successo della sua azienda, anche se comunque non sono pochi i dubbi intorno alla reale possibilità di creare un modello così avanzato con le cifre diffuse da DeepSeek. Le preoccupazioni riguardano anche la potenziale vulnerabilità dei dati degli utenti, con timori che informazioni sensibili possano essere trasferite su server in Cina. Inoltre, sono emerse perplessità anche su alcune risposte generate dal sistema, che in alcuni casi sembrano riflettere la posizione ufficiale del governo cinese su temi estremamente delicati. Quello che è chiaro è che la Cina non vuole darsi già per sconfitta nella battaglia dell'IA e sta iniziando a giocare le sue carte. In questo contesto, bisogna capire quale sarà il ruolo che avrà l'Unione Europea, che vuole proporsi come leader globale nell'innovazione tecnologica ma che fatica a mostrare risultati tangibili. L'approccio europeo, che pone l'accento su regole etiche e protezione dei dati, rischia di trasformarsi in un freno allo sviluppo tecnologico, o in un'assenza che inizia a diventare sempre più pesante in quella che potrebbe essere definita la guerra del secolo, almeno in ambito tecnologico.

15 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Ginopilot29 Gennaio 2025, 16:02 #1
E le schede nvidia le hanno rubate?
Ago7229 Gennaio 2025, 16:09 #2
Scusatemi, ma questa ricerca del miracolo mi lascia sempre perplesso. Si parla comunque di un investimento di un miliardo di dollari per l'acquisto delle GPU, che qualcuno gli ha dato.
A oggi non è chiaro in cosa sta l'innovazione. Dopo l'arrivo di ChatGPT, in breve tempo sono arrivate diverse AI generative e nessuno ha urlato al miracolo.
Se poi verrà confermato che DeepSeek ha usato ChatGPT, in parte, per addesstrarsi, allora siamo di "nuovo al vecchio", un prodotto Cinese che copia le funzionalità di altri prodotti e viene proposto a un prezzo più basso.
Ad oggi la vera innovazione è CHtGPT, per ora si assitono solo a cloni e questo è uno di essi.
Saturn29 Gennaio 2025, 16:09 #3
Originariamente inviato da: Ginopilot
E le schede nvidia le hanno rubate?


Tutt'altro.

[...]mentre nel 2021 l'imprenditore ha iniziato ad accumulare GPU NVIDIA per un progetto IA non meglio identificato, in fortunoso anticipo rispetto alle restrizioni di Biden (2022) che avrebbero impedito alle realtà cinesi di utilizzare quei chip[...]

E ancora:

[...]DeepSeek ha dovuto affrontare la difficoltà di utilizzare chip NVIDIA limitati a causa delle restrizioni statunitensi, fattore che ha portato il team a rielaborare il processo di addestramento, riducendo il carico sulle GPU e consentendo di ottenere risultati comparabili ai concorrenti con un numero significativamente inferiore di chip.[...]

Il discorso è che un passo alla volta si svincolano dalle dipendenze con l'occidente. Anche lato hardware con le loro GPU/CPU non è un mistero che stiano facendo passi da gigante in tempi veramente brevi. E soprattutto stanno fornendo gli stessi servizi a una frazione del costo. Tutto qua. I dazi, gli embarghi, i muri...ecco forse è il caso che si mettano seduti ad un tavolini e capire come gestire meglio tutta la faccenda...perchè per come la portano avanti...non mi sembra che li stia molto impensierendo o fermando...i Cinesi.

Originariamente inviato da: Ago72
Se poi verrà confermato che DeepSeek ha usato ChatGPT in parte per addesstrarsi, allora siamo di "nuovo al vecchio", un prodotto Cinese che copia le funzionalità di altri prodotti e viene proposto a un prezzo più basso.


E ti sembra poco ?
Ripper8929 Gennaio 2025, 16:10 #4
Originariamente inviato da: Ginopilot
E le schede nvidia le hanno rubate?


Perchè dovrebbero rubarle ?
Nvidia continua a vendere ai cinesi sia direttamente con modelli appositi per il mercato cinese, sia probabilmente tramite altre aziende o privati che fungono da intermediarie.
Ago7229 Gennaio 2025, 16:11 #5
Originariamente inviato da: Ginopilot
E le schede nvidia le hanno rubate?


Il marketing non è prerogativa delle sole società occidentali... Il punto è non cascarci.
Haran Banjo29 Gennaio 2025, 16:26 #6
"L'uomo che ha messo in ginocchio un intero settore e tutta la sua *narrativa*?!?

Ginopilot29 Gennaio 2025, 16:32 #7
Quindi nei 6 milioni sarebbero comprese le schede nvidia?
Altro aspetto, i detentori dei diritti sulle informazioni usate per l’addestramento, sono stati pagati?
I conti non tornano. Con quella cifra non ci fai nulla.
Rei & Asuka29 Gennaio 2025, 16:42 #8
Ecco, riprendendo commenti precedenti, un titolo del genere me lo aspetto da qualche niubbo del Corsera o fuffa simile.
Qui mi aspettavo di meglio, detto francamente...
coschizza29 Gennaio 2025, 16:57 #9
Originariamente inviato da: Rei &
Ecco, riprendendo commenti precedenti, un titolo del genere me lo aspetto da qualche niubbo del Corsera o fuffa simile.
Qui mi aspettavo di meglio, detto francamente...


pensavo la stessa cosa
djfix1329 Gennaio 2025, 17:03 #10

ma che titolo è??

ma davvero!? Redazione cosa scrivete?
"e messo in ginocchio l'industria IA" de chè?
Nvidia sè manco scomposta... 'ma fatemi il piacere...'cit.Totò

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^