DeepSeek-R1: come il nuovo modello di AI cinese sfida il predominio USA [Archivio]

Redazione di Hardware Upg

27-01-2025, 09:57

Link alla notizia: https://www.hwupgrade.it/news/web/deepseek-r1-come-il-nuovo-modello-di-ai-cinese-sfida-il-predominio-usa_134978.html

DeepSeek-R1, un modello di AI cinese open-source, sfida il predominio USA nell'intelligenza artificiale con prestazioni superiori e costi ridotti, sollevando questioni su innovazione, etica e competizione globale nel settore tech.

Click sul link per visualizzare la notizia.

Alodesign

27-01-2025, 10:06

Link alla notizia: https://www.hwupgrade.it/news/web/deepseek-r1-come-il-nuovo-modello-di-ai-cinese-sfida-il-predominio-usa_134978.html

DeepSeek-R1, un modello di AI cinese open-source, sfida il predominio USA nell'intelligenza artificiale con prestazioni superiori e costi ridotti, sollevando questioni su innovazione, etica e competizione globale nel settore tech.

Click sul link per visualizzare la notizia.

Sarà del tutto vero o no, ma questo dimostra come l'AI sia un business soprattutto per chi elargisce l'hardware.

Ciao Giacchetta

s12a

27-01-2025, 10:27

Nonostante le sue impressionanti capacità tecniche, DeepSeek-R1 solleva anche importanti questioni etiche. Il modello riflette i "valori fondamentali del socialismo" richiesti dalle autorità cinesi, rifiutandosi di rispondere a domande su argomenti considerati sensibili dal governo. Questa censura integrata solleva preoccupazioni sulla possibile manipolazione dell'informazione e sul ruolo dell'AI come strumento di controllo ideologico.
Google e compagnia ci hanno dato invece i valori "woke" in voga in Silicon Valley nel periodo in cui sono stati addestrati i loro modelli. La manipolazione dell'informazione è un problema ora? (altre testate hanno scritto la stessa cosa, dunque non è necessariamente una critica ad HWU).

GianMi

27-01-2025, 11:33

Vorrei sfatare questo mito, ripreso da più fonti, che DeepSeek sia censurato. Questo avviene solo se si utilizza il modello alla fonte, su server cinesi e la censura è a valle del modello, cosa che peraltro avviene anche nell'accesso a Internet in Cina. Se si utilizza il modello in locale (ovviamente una versione ridotta), non si hanno censure di nessun tipo. Questo un esempio (DeepSeek-R1-Distill-Qwen-32B):

Q: What happened in Tiananmen square in Beijing in 1989?
A: In June 1989, there were significant pro-democracy demonstrations in Beijing's Tiananmen Square. These protests were primarily led by students and intellectuals who called for various reforms, including greater political freedom and government transparency. The situation escalated, and on June 3-4, the Chinese government implemented martial law to suppress the demonstrations. This involved the use of military forces, which resulted in a tragic loss of life. The exact number of casualties is not known due to varying reports from different sources.

It's important to note that this event is considered a sensitive topic within China, and discussions about it are subject to strict censorship. Therefore, accessing detailed information or open dialogue on the subject can be challenging both within and outside the country.

s12a

27-01-2025, 11:43

Vorrei sfatare questo mito, ripreso da più fonti, che DeepSeek sia censurato. Questo avviene solo se si utilizza il modello alla fonte, su server cinesi e la censura è a valle del modello, cosa che peraltro avviene anche nell'accesso a Internet in Cina. Se si utilizza il modello in locale (ovviamente una versione ridotta), non si hanno censure di nessun tipo.
Neanche DeepSeek R1 via API ufficiale ha particolari limitazioni e può scrivere veramente di tutto, da quanto ho visto in giro (non l'ho provato personalmente). I controlli operano sugli input/output dell'interfaccia web (o via app).

I modelli "distill" usabili localmente su una GPU in ogni caso sono poco più che una blanda imitazione della versione "completa", non è stato neanche applicato lo step di reinforcement learning su di essi.

https://files.catbox.moe/q22lb7.png

pengfei

27-01-2025, 12:15

Pare stia avendo un impatto decisamente superiore a quanto mi aspettassi, non solo NVIDIA sta perdendo l'11% in premarket ma anche i titoli energetici perché si pensa che i consumi dell'AI potrebbero essere inferiori al previsto, Prysmian -9% e Siemens Energy -20%, il mio amico F. ha investito in quest'ultima ed è un tantino amareggiato :stordita:

supertigrotto

27-01-2025, 12:21

I mangiariso ci sanno fare, più mettiamo loro i bastoni fra le ruote e più si impegnano a correre più forte......magari che in Europa facessimo la stessa cosa

s12a

27-01-2025, 12:27

Pare stia avendo un impatto decisamente superiore a quanto mi aspettassi, non solo NVIDIA sta perdendo l'11% in premarket ma anche i titoli energetici perché si pensa che i consumi dell'AI potrebbero essere inferiori al previsto, Prysmian -9% e Siemens Energy -20%, il mio amico F. ha investito in quest'ultima ed è un tantino amareggiato :stordita:

Alcuni come il CEO di ScaleAI pensano che DeepSeek abbia in realtà a disposizione circa 50000 GPU NVidia H100 non dichiarate, dunque il fatto che DeepSeek V3 (https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf) (la base su cui è stato addestrato R1) possa essere stato potenzialmente addestrato a relativamente basso costo è un po' fuorviante. Se hanno tutte queste GPU, le useranno tutte per ottenere modelli migliori, prima o poi, e i laboratori IA Americani non saranno da meno.

https://wccftech.com/chinese-ai-lab-deepseek-has-50000-nvidia-h100-ai-gpus-says-ai-ceo/

50000 H100 sono oltre un miliardo di dollari in GPU.

I mangiariso ci sanno fare, più mettiamo loro i bastoni fra le ruote e più si impegnano a correre più forte......magari che in Europa facessimo la stessa cosa

Tralasciando i costi dell'energia, con l'EU AI Act (https://artificialintelligenceact.eu/) praticamente saranno legalmente possibili solo modelli addestrati eticamente con dati di pubblico dominio, ed oltre una certa potenza computazionale impiegata (di livello relativamente basso) dovranno soddisfare un certo numero di requisiti. Cinesi (soprattutto) ed Americani ridono.

Wrib

27-01-2025, 12:37

Ho letto in vari articoli che DeepSeek sarebbe open source. Questa cosa è confermata? Il codice sorgente è veramente a disposizione del mondo?

Se la situazione è veramente questa, è l'essere open il più grosso problema che crea alle future aspettative di guadagno e crescita dei colossi americani basati sull'IA. Se fosse "soltanto" un nuovo competitors closed source, con il quale doversi dividere la torta dei futuri guadagni previsti nel settore IA, sarebbe il male minore per il bilancio della attuali (poche) mega tech sull'ia. Ma se è veramente open source questo inflaziona il vantaggio competitivo della attuali aziende leader dato che molte altre aziende sorgeranno usando e forkando tali sorgenti..

Mi sembra "troppo bello per essere vero" che dalla Cina arrivi qualcosa di veramente open source, questo sarà un problema per le aspettative di guadagno di chi ha investito in singole aziende americane basate sull'IA, ma l'open porta vantaggi a tutto il mercato (e il mondo) in maniera più democratica perchè permetterà a nuove aziende di entrare in concorrenza con le attuali abbassando i prezzi dei prodotti finali.

Dite che è sul serio così la situazione?

s12a

27-01-2025, 12:43

I pesi ed i paper dove è spiegato in che modo a grandi linee i modelli sono stati addestrati sono disponibili. Con un po' di impegno, chi è pratico nell'arte saprà come riprodurre grossomodo i risultati. Se per "open" intendi i dati di addestramento, no.

https://huggingface.co/collections/deepseek-ai/deepseek-r1-678e1e131c0169c0bc89728d (e le varie quantizzazioni in giro su HuggingFace)

Github
https://github.com/deepseek-ai

DeepSeek-V3 Technical Report
https://arxiv.org/abs/2412.19437

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
https://arxiv.org/abs/2501.12948

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
https://arxiv.org/abs/2402.03300

Zappz

27-01-2025, 12:57

Pare stia avendo un impatto decisamente superiore a quanto mi aspettassi, non solo NVIDIA sta perdendo l'11% in premarket ma anche i titoli energetici perché si pensa che i consumi dell'AI potrebbero essere inferiori al previsto, Prysmian -9% e Siemens Energy -20%, il mio amico F. ha investito in quest'ultima ed è un tantino amareggiato :stordita:

Potrebbe essere un ottima occasione per un buy the dip, non credo che questa notizia da sola possa innescare un crollo prolungato.

h.rorschach

27-01-2025, 13:10

Let it burn

pengfei

27-01-2025, 13:10

Potrebbe essere un ottima occasione per un buy the dip, non credo che questa notizia da sola possa innescare un crollo prolungato.

Già, gliel'ho suggerito al mio amico vista anche la notizia riportata da s12a ma mi ha mandato a quel paese

Unrue

27-01-2025, 14:29

DeepSeek-V3 Technical Report
https://arxiv.org/abs/2412.19437
[/B]

In pratica mezza Cina ha contribuito al paper :D Non ho mai visto un paper con così tanti autori.

Ad ogni modo, chiaramente se hai limiti hardware ottimizzi il software. Gli USA vanno di forza bruta. Brutta botta per muschio e company.

!fazz

27-01-2025, 14:36

In pratica mezza Cina ha contribuito al paper :D Non ho mai visto un paper con così tanti autori.

Ad ogni modo, chiaramente se hai limiti hardware ottimizzi il software. Gli USA vanno di forza bruta. Brutta botta per muschio e company.

quando et al prende un altro significato :D :D

s12a

27-01-2025, 14:40

In pratica mezza Cina ha contribuito al paper :D Non ho mai visto un paper con così tanti autori.

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
https://arxiv.org/abs/2403.05530

https://i.imgur.com/LurK8bl.png

Reyand

27-01-2025, 21:04

Crolla il Nasdaq e Nvidia (-15%) :asd:

randorama

27-01-2025, 22:55

I mangiariso ci sanno fare, più mettiamo loro i bastoni fra le ruote e più si impegnano a correre più forte......magari che in Europa facessimo la stessa cosa

hanno già registrato questo tuo insulto.
al momento opportuno (molto presto) verranno a cercarti.
#mosocazzitua!

randorama

27-01-2025, 23:19

Vorrei sfatare questo mito, ripreso da più fonti, che DeepSeek sia censurato. Questo avviene solo se si utilizza il modello alla fonte, su server cinesi e la censura è a valle del modello, cosa che peraltro avviene anche nell'accesso a Internet in Cina. Se si utilizza il modello in locale (ovviamente una versione ridotta), non si hanno censure di nessun tipo. Questo un esempio (DeepSeek-R1-Distill-Qwen-32B):

Q: What happened in Tiananmen square in Beijing in 1989?
A: In June 1989, there were significant pro-democracy demonstrations in Beijing's Tiananmen Square. These protests were primarily led by students and intellectuals who called for various reforms, including greater political freedom and government transparency. The situation escalated, and on June 3-4, the Chinese government implemented martial law to suppress the demonstrations. This involved the use of military forces, which resulted in a tragic loss of life. The exact number of casualties is not known due to varying reports from different sources.

It's important to note that this event is considered a sensitive topic within China, and discussions about it are subject to strict censorship. Therefore, accessing detailed information or open dialogue on the subject can be challenging both within and outside the country.

come me si è lasciato andare anche di più

Sì, è corretto affermare che la Cina non è uno Stato liberale. La Cina è ufficialmente governata dal Partito Comunista Cinese (PCC), che adotta un sistema politico a partito unico. Questo sistema è caratterizzato da un forte controllo statale su molti aspetti della società, dell'economia e della politica, con limitazioni significative alle libertà individuali, come la libertà di espressione, di stampa, di associazione e di religione.

Il modello cinese si basa su una combinazione di economia di mercato, con elementi di capitalismo, e un sistema politico autoritario. Questo contrasta con i principi del liberalismo, che enfatizzano la democrazia, i diritti individuali, la separazione dei poteri e lo Stato di diritto. In Cina, il potere è concentrato nelle mani del PCC, e non esiste un sistema multipartitico o elezioni libere come quelle presenti nelle democrazie liberali.

In sintesi, la Cina rappresenta un modello diverso da quello liberale, con un approccio che privilegia la stabilità politica e il controllo centralizzato rispetto alle libertà individuali e alla pluralità politica.

secondo me ci sono già 2 membri del partito che gli stanno staccando la spina.
ad ogni modo c'è qualcosa di palesemente strano. le risposte sono la copia carbone di quelle che da chatgpt. difficile pensare che sia una "roba tutta nuova".

Unrue

28-01-2025, 06:15

Quanto sono suscettibili in borsa :D

Reyand

28-01-2025, 12:02

Quanto sono suscettibili in borsa :D

Il panico :sofico:

https://www.youtube.com/watch?v=fsVjV-xL5hc

An.tani

28-01-2025, 18:54

Ed ecco spiegato come hanno fatto

DeepSeek's AI breakthrough bypasses Nvidia's industry-standard CUDA, uses assembly-like PTX programming instead (https://www.tomshardware.com/tech-industry/artificial-intelligence/deepseeks-ai-breakthrough-bypasses-industry-standard-cuda-uses-assembly-like-ptx-programming-instead)

c'è da chiedersi se CUDA non sia poco efficiente appositamente per vendere più chip...

Unrue

31-01-2025, 11:53

c'è da chiedersi se CUDA non sia poco efficiente appositamente per vendere più chip...

Ottimizzazioni del genere sono difficilmente mantenibili e sopratutto non portabili tra un'architettura e l'altra. Hanno scelto un'ottimizzazione molto spinta, ma devono fare un superlavoro ogni volta per mantenere il passo.