|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75166
|
Link alla notizia: https://www.hwupgrade.it/news/web/ne...ci_151215.html
NVIDIA ha presentato Nemotron 3 Super, un modello AI open da 120 miliardi di parametri progettato per applicazioni multi-agente. Grazie a una finestra di contesto da 1 milione di token, architettura ibrida Mamba-Transformer e inferenza ottimizzata per GPU Blackwell, punta a ridurre costi e complessità nei workflow autonomi. Click sul link per visualizzare la notizia. |
|
|
|
|
|
#2 | |
|
Senior Member
Iscritto dal: Feb 2019
Città: Origgio
Messaggi: 2039
|
Premetto che non so quasi nulla di AI ma giusto per capire.
Il modello è open ma questa ottimizzazione Quote:
|
|
|
|
|
|
|
#3 | |
|
Senior Member
Iscritto dal: Aug 2006
Città: Valdagno
Messaggi: 6348
|
Quote:
Nvfp4 richiede hardware Nvidia,potrebbe girare anche su altro hardware ma ci girerà male naturalmente. |
|
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11238
|
Nella pratica non ci sono molte alternative reali ad NVidia se vuoi usare LLM localmente, ma è sempre possible convertire da NVFP4 ad altri formati compatibili anche con CPU (se hai memoria RAM multicanale sufficientemente veloce), come è stato già fatto qui:
https://huggingface.co/unsloth/NVIDI...120B-A12B-GGUF Blackwell ha supporto nativo (hardware) per il formato NVFP4, ma alla fine per l'inferenza il limite prestazionale è dato principalmente dalla larghezza di banda della memoria.
__________________
~
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 18:45.




















