|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/scienz...to_141974.html
OpenAI lancia due modelli AI open-weight, gpt-oss-120b e gpt-oss-20b, scaricabili e gestibili in locale anche su piattaforme consumer. Sono testuali, facilmente personalizzabili, con prestazioni vicine ai modelli cloud proprietari e focus su privacy e sicurezza. Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Sep 2009
Messaggi: 4461
|
sbagliato.... 16GB di Vram, non memoria...
__________________
CASE: PHANTEKS P500A| MOBO: ROG STRIX Z690-F GAMING WIFI| CPU: i9-12900K| DISSIPATORE: LIQUID FREEZER II 420mm| RAM: TEAMGROUP XTREEM 32GB @6600MHz CL34| STORAGE: vari Nvme| VGA: ZOTAC RTX 3070 Ti| ALI: CORSAIR RM1000X| S.O: WINDOWS 11 PRO X64 |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Dec 1999
Messaggi: 5358
|
Beh, puoi sempre farle girare su CPU.
By(t)e
__________________
Vicking73: "Arecibo è un radiotelescopio che stà in Brasile" marzionieddu: "...stiamo cercando qualcosa nel totale silenzio cosmico..." |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Sep 2009
Messaggi: 4461
|
già, facendo un conto i core della cpu saranno al massimo 16, quelli della gpu 6000 o più... a sto punto carichiamolo direttamente su HDD meccanico, tanto il collo di bottiglia lo fa la cpu
![]()
__________________
CASE: PHANTEKS P500A| MOBO: ROG STRIX Z690-F GAMING WIFI| CPU: i9-12900K| DISSIPATORE: LIQUID FREEZER II 420mm| RAM: TEAMGROUP XTREEM 32GB @6600MHz CL34| STORAGE: vari Nvme| VGA: ZOTAC RTX 3070 Ti| ALI: CORSAIR RM1000X| S.O: WINDOWS 11 PRO X64 |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Dec 2001
Città: Planet Saturn (♄)
Messaggi: 17715
|
Ryzen 3950x, 128 GB RAM, ARC A770 16 GB.
Potrei tentare.. ![]() |
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jan 2010
Messaggi: 7424
|
Dai dai scaricala ti prego, poi facci qualche foto modificata e postala qui, tipo Jessica Alba NUDA, con la faccia di Rosy Bindi peró
__________________
Telegram: @shutter1sland |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 11745
|
possono essere runnate cpu only anche se più lentamente con 16/32 gb di ram?
__________________
Ho fatto affari con: troppi per elencarli Vendo: NAS PRO QNAP 4 BAIE 419P+ CON LCD |
![]() |
![]() |
![]() |
#8 |
Senior Member
Iscritto dal: Sep 2009
Messaggi: 4461
|
non penso, però ci sono modelli più leggeri che occupano meno di 4GB di vram
__________________
CASE: PHANTEKS P500A| MOBO: ROG STRIX Z690-F GAMING WIFI| CPU: i9-12900K| DISSIPATORE: LIQUID FREEZER II 420mm| RAM: TEAMGROUP XTREEM 32GB @6600MHz CL34| STORAGE: vari Nvme| VGA: ZOTAC RTX 3070 Ti| ALI: CORSAIR RM1000X| S.O: WINDOWS 11 PRO X64 |
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Dec 1999
Messaggi: 5358
|
Quote:
Certo, ci vuole calma e sangue freddo ad aspettare, però si fa ![]() By(t)e
__________________
Vicking73: "Arecibo è un radiotelescopio che stà in Brasile" marzionieddu: "...stiamo cercando qualcosa nel totale silenzio cosmico..." |
|
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: Sep 2022
Messaggi: 1744
|
Secondo me non e' errato in quanto richiedono mediamente sia 16GB di VRAM che di RAM, senza contare che alcune, anche quando non serve perche' ne hai tanta, richiedono attivo anche il file di swapping o ritornano errore.
|
![]() |
![]() |
![]() |
#11 |
Senior Member
Iscritto dal: Dec 2001
Città: Planet Saturn (♄)
Messaggi: 17715
|
@aqua84
EH ? ![]() ...lo sai vero che da grandi poteri derivano grandi responsabilità ? Mi dispiace ma è un secco no la mia risposta ! ![]() ![]() |
![]() |
![]() |
![]() |
#12 |
Senior Member
Iscritto dal: Oct 2009
Messaggi: 3652
|
con una Nvidia H100 da quasi 40000 euro e 80GB di Vram...qualsiasi CPU desktop sfigurerebbe!
|
![]() |
![]() |
![]() |
#13 | ||||
Senior Member
Iscritto dal: Apr 2007
Messaggi: 920
|
no, questi modelli sono in formato GGUF quindi puoi farli andare contemporaneamente (per modo di dire) su cpu e gpu, la gpu fa offloading dei layer in maniera dinamica quindi il 20b può girare anche su una vga con 8gb di vram purchè il sistema abbia almeno 16gb di ram (ma ne occupa molti meno perchè "swappa" su vram )
esatto ma cè un però, con una rtx 3070 fai circa 7 o 8 token al secondo, per darti un messaggio completo di un codice in python ad esempio potrebbe metterci un minuto intero o anche più Quote:
teoricamente i client supportano l'accelerazione tramite vulkan, cuda sarebbe meglio poichè si appoggiano a pytorch ed hai accelerazione diretta con i tensor (non sempre) Quote:
Quote:
Quote:
confermo, llama.cpp ad oggi supporta multi-GPU solo con backend CUDA (zluda su ati forse) e in modo statico cioè devi dire in anticipo quanti layer mettere su ogni GPU (ad esempio : --gpu-layers --split-mode e variabili per device index). ipoteticamente se riesci a procurarti almeno 4 rtx serie 3xxx usate da 16gb di vram ciascuna, anche non particolarmente potenti, con un 32gb di ram dovresti potercela fare addirittura a far girare con mooooolta calma anche il 120b (tanta roba imho) quello lo puoi fare easy anche con un laptop, ti scarichi comfyui, fai un giro su civitai, ti scegli un bel checkpoint nsfw in formato .safetensor (modello base di stablediffusion, sceglilo di tipo sdxl se hai almeno 8gb di vram) e ti puoi sbizzarrire quanto vuoi a generare ogni cosa ma occhio che i modelli per questioni di "etica" non hanno nel loro datased celebrità o altro, recentemente cè stato anche un polverone riguardo i lora di personaggi famosi (moduli aggiuntivi per aggiungere roba ai checkpoint) quindi quelli li troverai su altri siti meno famosi percui si, quello che hai descritto (purtroppo) si può fare. Ultima modifica di EMAXTREME : 12-08-2025 alle 22:43. |
||||
![]() |
![]() |
![]() |
#14 | |
Senior Member
Iscritto dal: Sep 2009
Messaggi: 4461
|
Quote:
__________________
CASE: PHANTEKS P500A| MOBO: ROG STRIX Z690-F GAMING WIFI| CPU: i9-12900K| DISSIPATORE: LIQUID FREEZER II 420mm| RAM: TEAMGROUP XTREEM 32GB @6600MHz CL34| STORAGE: vari Nvme| VGA: ZOTAC RTX 3070 Ti| ALI: CORSAIR RM1000X| S.O: WINDOWS 11 PRO X64 |
|
![]() |
![]() |
![]() |
#15 |
Senior Member
Iscritto dal: Apr 2007
Messaggi: 920
|
per farlo andare ad una velocità "normale" conviene caricarlo tutto in vram ma con 8gb di vram ed una rtx3xxx funziona bene ugualmente, circa sui 6 o 10 token/s che non sarà poi così tanto ma neanche così lento da non poterlo usare
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 05:22.