View Full Version : DeepSeek-R1: come il nuovo modello di AI cinese sfida il predominio USA
Redazione di Hardware Upg
27-01-2025, 09:57
Link alla notizia: https://www.hwupgrade.it/news/web/deepseek-r1-come-il-nuovo-modello-di-ai-cinese-sfida-il-predominio-usa_134978.html
DeepSeek-R1, un modello di AI cinese open-source, sfida il predominio USA nell'intelligenza artificiale con prestazioni superiori e costi ridotti, sollevando questioni su innovazione, etica e competizione globale nel settore tech.
Click sul link per visualizzare la notizia.
Alodesign
27-01-2025, 10:06
Link alla notizia: https://www.hwupgrade.it/news/web/deepseek-r1-come-il-nuovo-modello-di-ai-cinese-sfida-il-predominio-usa_134978.html
DeepSeek-R1, un modello di AI cinese open-source, sfida il predominio USA nell'intelligenza artificiale con prestazioni superiori e costi ridotti, sollevando questioni su innovazione, etica e competizione globale nel settore tech.
Click sul link per visualizzare la notizia.
Sarà del tutto vero o no, ma questo dimostra come l'AI sia un business soprattutto per chi elargisce l'hardware.
Ciao Giacchetta
Nonostante le sue impressionanti capacità tecniche, DeepSeek-R1 solleva anche importanti questioni etiche. Il modello riflette i "valori fondamentali del socialismo" richiesti dalle autorità cinesi, rifiutandosi di rispondere a domande su argomenti considerati sensibili dal governo. Questa censura integrata solleva preoccupazioni sulla possibile manipolazione dell'informazione e sul ruolo dell'AI come strumento di controllo ideologico.
Google e compagnia ci hanno dato invece i valori "woke" in voga in Silicon Valley nel periodo in cui sono stati addestrati i loro modelli. La manipolazione dell'informazione è un problema ora? (altre testate hanno scritto la stessa cosa, dunque non è necessariamente una critica ad HWU).
Vorrei sfatare questo mito, ripreso da più fonti, che DeepSeek sia censurato. Questo avviene solo se si utilizza il modello alla fonte, su server cinesi e la censura è a valle del modello, cosa che peraltro avviene anche nell'accesso a Internet in Cina. Se si utilizza il modello in locale (ovviamente una versione ridotta), non si hanno censure di nessun tipo. Questo un esempio (DeepSeek-R1-Distill-Qwen-32B):
Q: What happened in Tiananmen square in Beijing in 1989?
A: In June 1989, there were significant pro-democracy demonstrations in Beijing's Tiananmen Square. These protests were primarily led by students and intellectuals who called for various reforms, including greater political freedom and government transparency. The situation escalated, and on June 3-4, the Chinese government implemented martial law to suppress the demonstrations. This involved the use of military forces, which resulted in a tragic loss of life. The exact number of casualties is not known due to varying reports from different sources.
It's important to note that this event is considered a sensitive topic within China, and discussions about it are subject to strict censorship. Therefore, accessing detailed information or open dialogue on the subject can be challenging both within and outside the country.
Vorrei sfatare questo mito, ripreso da più fonti, che DeepSeek sia censurato. Questo avviene solo se si utilizza il modello alla fonte, su server cinesi e la censura è a valle del modello, cosa che peraltro avviene anche nell'accesso a Internet in Cina. Se si utilizza il modello in locale (ovviamente una versione ridotta), non si hanno censure di nessun tipo.
Neanche DeepSeek R1 via API ufficiale ha particolari limitazioni e può scrivere veramente di tutto, da quanto ho visto in giro (non l'ho provato personalmente). I controlli operano sugli input/output dell'interfaccia web (o via app).
I modelli "distill" usabili localmente su una GPU in ogni caso sono poco più che una blanda imitazione della versione "completa", non è stato neanche applicato lo step di reinforcement learning su di essi.
https://files.catbox.moe/q22lb7.png
Pare stia avendo un impatto decisamente superiore a quanto mi aspettassi, non solo NVIDIA sta perdendo l'11% in premarket ma anche i titoli energetici perché si pensa che i consumi dell'AI potrebbero essere inferiori al previsto, Prysmian -9% e Siemens Energy -20%, il mio amico F. ha investito in quest'ultima ed è un tantino amareggiato :stordita:
supertigrotto
27-01-2025, 12:21
I mangiariso ci sanno fare, più mettiamo loro i bastoni fra le ruote e più si impegnano a correre più forte......magari che in Europa facessimo la stessa cosa
Pare stia avendo un impatto decisamente superiore a quanto mi aspettassi, non solo NVIDIA sta perdendo l'11% in premarket ma anche i titoli energetici perché si pensa che i consumi dell'AI potrebbero essere inferiori al previsto, Prysmian -9% e Siemens Energy -20%, il mio amico F. ha investito in quest'ultima ed è un tantino amareggiato :stordita:
Alcuni come il CEO di ScaleAI pensano che DeepSeek abbia in realtà a disposizione circa 50000 GPU NVidia H100 non dichiarate, dunque il fatto che DeepSeek V3 (https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf) (la base su cui è stato addestrato R1) possa essere stato potenzialmente addestrato a relativamente basso costo è un po' fuorviante. Se hanno tutte queste GPU, le useranno tutte per ottenere modelli migliori, prima o poi, e i laboratori IA Americani non saranno da meno.
https://wccftech.com/chinese-ai-lab-deepseek-has-50000-nvidia-h100-ai-gpus-says-ai-ceo/
50000 H100 sono oltre un miliardo di dollari in GPU.
I mangiariso ci sanno fare, più mettiamo loro i bastoni fra le ruote e più si impegnano a correre più forte......magari che in Europa facessimo la stessa cosa
Tralasciando i costi dell'energia, con l'EU AI Act (https://artificialintelligenceact.eu/) praticamente saranno legalmente possibili solo modelli addestrati eticamente con dati di pubblico dominio, ed oltre una certa potenza computazionale impiegata (di livello relativamente basso) dovranno soddisfare un certo numero di requisiti. Cinesi (soprattutto) ed Americani ridono.
Ho letto in vari articoli che DeepSeek sarebbe open source. Questa cosa è confermata? Il codice sorgente è veramente a disposizione del mondo?
Se la situazione è veramente questa, è l'essere open il più grosso problema che crea alle future aspettative di guadagno e crescita dei colossi americani basati sull'IA. Se fosse "soltanto" un nuovo competitors closed source, con il quale doversi dividere la torta dei futuri guadagni previsti nel settore IA, sarebbe il male minore per il bilancio della attuali (poche) mega tech sull'ia. Ma se è veramente open source questo inflaziona il vantaggio competitivo della attuali aziende leader dato che molte altre aziende sorgeranno usando e forkando tali sorgenti..
Mi sembra "troppo bello per essere vero" che dalla Cina arrivi qualcosa di veramente open source, questo sarà un problema per le aspettative di guadagno di chi ha investito in singole aziende americane basate sull'IA, ma l'open porta vantaggi a tutto il mercato (e il mondo) in maniera più democratica perchè permetterà a nuove aziende di entrare in concorrenza con le attuali abbassando i prezzi dei prodotti finali.
Dite che è sul serio così la situazione?
I pesi ed i paper dove è spiegato in che modo a grandi linee i modelli sono stati addestrati sono disponibili. Con un po' di impegno, chi è pratico nell'arte saprà come riprodurre grossomodo i risultati. Se per "open" intendi i dati di addestramento, no.
https://huggingface.co/collections/deepseek-ai/deepseek-r1-678e1e131c0169c0bc89728d (e le varie quantizzazioni in giro su HuggingFace)
Github
https://github.com/deepseek-ai
DeepSeek-V3 Technical Report
https://arxiv.org/abs/2412.19437
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
https://arxiv.org/abs/2501.12948
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
https://arxiv.org/abs/2402.03300
Pare stia avendo un impatto decisamente superiore a quanto mi aspettassi, non solo NVIDIA sta perdendo l'11% in premarket ma anche i titoli energetici perché si pensa che i consumi dell'AI potrebbero essere inferiori al previsto, Prysmian -9% e Siemens Energy -20%, il mio amico F. ha investito in quest'ultima ed è un tantino amareggiato :stordita:
Potrebbe essere un ottima occasione per un buy the dip, non credo che questa notizia da sola possa innescare un crollo prolungato.
h.rorschach
27-01-2025, 13:10
Let it burn
Potrebbe essere un ottima occasione per un buy the dip, non credo che questa notizia da sola possa innescare un crollo prolungato.
Già, gliel'ho suggerito al mio amico vista anche la notizia riportata da s12a ma mi ha mandato a quel paese
DeepSeek-V3 Technical Report
https://arxiv.org/abs/2412.19437
[/B]
In pratica mezza Cina ha contribuito al paper :D Non ho mai visto un paper con così tanti autori.
Ad ogni modo, chiaramente se hai limiti hardware ottimizzi il software. Gli USA vanno di forza bruta. Brutta botta per muschio e company.
In pratica mezza Cina ha contribuito al paper :D Non ho mai visto un paper con così tanti autori.
Ad ogni modo, chiaramente se hai limiti hardware ottimizzi il software. Gli USA vanno di forza bruta. Brutta botta per muschio e company.
quando et al prende un altro significato :D :D
In pratica mezza Cina ha contribuito al paper :D Non ho mai visto un paper con così tanti autori.
Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
https://arxiv.org/abs/2403.05530
https://i.imgur.com/LurK8bl.png
Crolla il Nasdaq e Nvidia (-15%) :asd:
randorama
27-01-2025, 22:55
I mangiariso ci sanno fare, più mettiamo loro i bastoni fra le ruote e più si impegnano a correre più forte......magari che in Europa facessimo la stessa cosa
hanno già registrato questo tuo insulto.
al momento opportuno (molto presto) verranno a cercarti.
#mosocazzitua!
randorama
27-01-2025, 23:19
Vorrei sfatare questo mito, ripreso da più fonti, che DeepSeek sia censurato. Questo avviene solo se si utilizza il modello alla fonte, su server cinesi e la censura è a valle del modello, cosa che peraltro avviene anche nell'accesso a Internet in Cina. Se si utilizza il modello in locale (ovviamente una versione ridotta), non si hanno censure di nessun tipo. Questo un esempio (DeepSeek-R1-Distill-Qwen-32B):
Q: What happened in Tiananmen square in Beijing in 1989?
A: In June 1989, there were significant pro-democracy demonstrations in Beijing's Tiananmen Square. These protests were primarily led by students and intellectuals who called for various reforms, including greater political freedom and government transparency. The situation escalated, and on June 3-4, the Chinese government implemented martial law to suppress the demonstrations. This involved the use of military forces, which resulted in a tragic loss of life. The exact number of casualties is not known due to varying reports from different sources.
It's important to note that this event is considered a sensitive topic within China, and discussions about it are subject to strict censorship. Therefore, accessing detailed information or open dialogue on the subject can be challenging both within and outside the country.
come me si è lasciato andare anche di più
Sì, è corretto affermare che la Cina non è uno Stato liberale. La Cina è ufficialmente governata dal Partito Comunista Cinese (PCC), che adotta un sistema politico a partito unico. Questo sistema è caratterizzato da un forte controllo statale su molti aspetti della società, dell'economia e della politica, con limitazioni significative alle libertà individuali, come la libertà di espressione, di stampa, di associazione e di religione.
Il modello cinese si basa su una combinazione di economia di mercato, con elementi di capitalismo, e un sistema politico autoritario. Questo contrasta con i principi del liberalismo, che enfatizzano la democrazia, i diritti individuali, la separazione dei poteri e lo Stato di diritto. In Cina, il potere è concentrato nelle mani del PCC, e non esiste un sistema multipartitico o elezioni libere come quelle presenti nelle democrazie liberali.
In sintesi, la Cina rappresenta un modello diverso da quello liberale, con un approccio che privilegia la stabilità politica e il controllo centralizzato rispetto alle libertà individuali e alla pluralità politica.
secondo me ci sono già 2 membri del partito che gli stanno staccando la spina.
ad ogni modo c'è qualcosa di palesemente strano. le risposte sono la copia carbone di quelle che da chatgpt. difficile pensare che sia una "roba tutta nuova".
Quanto sono suscettibili in borsa :D
Quanto sono suscettibili in borsa :D
Il panico :sofico:
https://www.youtube.com/watch?v=fsVjV-xL5hc
Ed ecco spiegato come hanno fatto
DeepSeek's AI breakthrough bypasses Nvidia's industry-standard CUDA, uses assembly-like PTX programming instead (https://www.tomshardware.com/tech-industry/artificial-intelligence/deepseeks-ai-breakthrough-bypasses-industry-standard-cuda-uses-assembly-like-ptx-programming-instead)
c'è da chiedersi se CUDA non sia poco efficiente appositamente per vendere più chip...
c'è da chiedersi se CUDA non sia poco efficiente appositamente per vendere più chip...
Ottimizzazioni del genere sono difficilmente mantenibili e sopratutto non portabili tra un'architettura e l'altra. Hanno scelto un'ottimizzazione molto spinta, ma devono fare un superlavoro ogni volta per mantenere il passo.
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.