|
|
|
![]() |
|
Strumenti |
![]() |
#21 | |
Member
Iscritto dal: Dec 2016
Città: Toulouse/Montpellier/Melbourne
Messaggi: 295
|
Quote:
Qui poi ci si scontra con la proverbiale trasparenza cinese da un lato e pure con un celolunghismo / gioco politico tra superpotenze dall’altro. Momenti del genere ce ne sono stati, seppur molto rari, ma mai della portata di quello che AI rappresenta oggi, nemmeno con tutte le perequazioni del caso. Ad ogni modo, in questi momenti chi costruisce da secondo prende tutto know how di chi ha tracciato la strada, potendosi focalizzare solo sull’extra mile. In questo modus operandi i cinesi non sono secondi a nessuno.
__________________
ds/dev, del resto non me ne intendo |
|
![]() |
![]() |
![]() |
#22 | |
Senior Member
Iscritto dal: Sep 2013
Messaggi: 9276
|
Quote:
|
|
![]() |
![]() |
![]() |
#23 | |
Senior Member
Iscritto dal: Sep 2008
Messaggi: 3269
|
Quote:
![]()
__________________
Mobo: Asus Prime X470 - CPU: Ryzen9 5900x - RAM: Corsair Vengeance 2x32gb 3600 - VGA: Asus TUF 4090 |
|
![]() |
![]() |
![]() |
#24 | |
Senior Member
Iscritto dal: Jan 2007
Messaggi: 6147
|
Quote:
Se ho capito bene, il costo che hanno dichiarato è quello di un singolo ciclo di addestramento di DeepSeek R3, escludendo: - i cicli di addestramento precedenti - i costi del personale - gli investimenti infrastrutturali. Nel documento pubblicato da DeepSeek stessa che si può reperire qui: https://arxiv.org/pdf/2412.19437v1 Risulta che: "Assuming the rental price of the H800 GPU is $2 per GPU hour, our total training costs amount to only $5.576M. Note that the aforementioned costs include only the official training of DeepSeek-V3, excluding the costs associated with prior research and ablation experiments on architectures, algorithms, or data." In pratica i "circa 6 milioni di costo" sono relativi solo al training run finale, non al costo complessivo reale. Poi c'è da aggiungere che DeepSeek è stata fondata ed è di proprietà di Ningbo High-Flyer Quantitative Investment Management Partnership (di solito chiamata solo High-Flyer oppure Ningbo High-Flyer), in pratica un hedge fund, che di certo non si è fatta sfuggire l'occasione di "giocare in anticipo" sulle prevedibili fluttuazioni delle azioni delle aziende coinvolte nello sviluppo di AI una volta che DeepSeek avesse sganciato la bomba dei "solo 6 milioni". |
|
![]() |
![]() |
![]() |
#25 | |
Senior Member
Iscritto dal: Jan 2022
Messaggi: 977
|
Quote:
Facciamo un paragone con il mondo dei videogiochi. Quanta potenza di calcolo, per una certa configurazione hardware, viene inutilizzata perchè le ore di lavoro extra degli sviluppatori necessarie a ottimizzare al massimo ogni configurazione sarebbero un costo eccessivo che non giustificherebbe il miglioramento? E' più comodo avere software ottimizzati quel tanto che basta, fermandosi dove l'incremento marginale di ulteriori performane date dall'ottimizzazione lato software non giustificare i costi di tali ulteriori sviluppi. E quindi si migliora lato hardware più comodamente, facendo affidamento a sempre più potenti ed energivore schede grafiche nuove. Parlando poi di console invece che di pc ricordiamo le console più antiche che a fine ciclo vitale sfornavano delle perle grafiche incredibili rispetto ad inizio gen. Erano sistemi meno complessi (e ogni gen diventava più complessa di quella prima) e quindi arrivare a sfruttare anche l'ultima goccia di potenza era meno dispendioso come sforzo di sviluppo. Inoltre erano sistemi unici, del tutto diversi dall'architettura simil pc usata dalle console più recenti e quindi si creavano kit di sviluppo molto specifici per un hardware unico, tool che si ottimizzavano ulteriormente nel corso di vita della console cucendosi addosso a tale unicità. Adesso chi te lo fa fare di spaccare l'atomo in 4 su ps5/ultimaxbox quando puoi fare un porting pigro per via della similitudine con l'architettura pc? Se la Cina si è trovata in una situzione in cui l'hardware non poteva più essere incrementato a piacere per i dazi e limitazioni varie avrà deciso di spendere moltissimo nel miglioramento lato software, spremento tutto quello che poteva da un certo hardware anche a costo di altissimo costi di sviluppo. Ultima modifica di Wrib : 28-01-2025 alle 13:16. |
|
![]() |
![]() |
![]() |
#26 | ||
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11149
|
Quote:
Qui un riassunto un po' meno semplificato da Reddit: Quote:
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
||
![]() |
![]() |
![]() |
#27 |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 3452
|
"Il titolo in borsa di Nvidia è calato del 17 per cento"
La festa starà per finire... finalmente? |
![]() |
![]() |
![]() |
#28 | |
Senior Member
Iscritto dal: Dec 2001
Città: Planet Saturn (♄)
Messaggi: 17862
|
Quote:
Comunque ben venga la concorrenza, sempre ! |
|
![]() |
![]() |
![]() |
#29 |
Member
Iscritto dal: Apr 2013
Messaggi: 246
|
So che non c'entra molto con il topic, ma in parte sì
![]() ![]() |
![]() |
![]() |
![]() |
#30 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 6167
|
|
![]() |
![]() |
![]() |
#31 |
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11149
|
Avevo provato tempo fa ad aprire un thread nella sezione Scienza e Tecnica per la discussione dei paper più interessanti in merito rilasciati du arXiv, ma non ha avuto molto successo ed alla fine ho lasciato perdere. In ogni caso, considerando che non c'è nulla di più esoso in termini di hardware degli LLM più capaci, mi sembra strano che ancora non ci sia una sezione apposita nel forum di Hardware Upgrade.
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
![]() |
![]() |
![]() |
#32 | ||
Senior Member
Iscritto dal: Sep 2013
Messaggi: 9276
|
Quote:
posso solo auspicare, o per meglio dire sperare che, se davvero così semplici, verranno presto implementate "dagli altri". quello che mi lascia davvero perplesso è il tenore delle risposte; sono praticamente identiche a quelle di chatgpt (cosa invece non vera per "gli altri" motori). a voler pensare male... Quote:
|
||
![]() |
![]() |
![]() |
#33 | ||
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11149
|
Quote:
Fortune - Meta is reportedly scrambling ‘war rooms’ of engineers to figure out how DeepSeek’s AI is beating everyone else at a fraction of the price Quote:
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
||
![]() |
![]() |
![]() |
#34 |
Senior Member
Iscritto dal: May 2008
Messaggi: 12933
|
se fosse vero vuol dire che si assisterà ad un calo del costo delle GPU visto che ne bastano di meno o ad un salto di qualità delle AI visto che con molta potenza possono fare molto di più... staremo a vedere..
ma se è veramente tutto open source come si dice qui allora tutti potranno vedere il codice usato e capire dove sono queste migliorie e far fare un salto di qualità (quantum leap) alle altre AI nel giro di pochi mesi.. oppure fra 6 mesi non sarà successo niente e questo deepseek si dimostrerà un imbroglio.. vedremo o è efficiente e la sua efficienza open source diventerà boost per gli altri o era fuffa e non cambierà niente |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 04:05.