Anthropic, Amodei ammette: "Non capiamo come funziona davvero l’IA"

Anthropic, Amodei ammette: "Non capiamo come funziona davvero l’IA"

Il CEO di Anthropic Dario Amodei riconosce l’ignoranza tecnica degli stessi creatori di intelligenze artificiali e punta a sviluppare entro dieci anni una "MRI per l’IA” per svelarne i meccanismi interni e mitigare rischi imprevisti

di pubblicata il , alle 11:51 nel canale Scienza e tecnologia
Anthropic
 

Il CEO di Anthropic, Dario Amodei, ha ammesso che gli stessi ideatori dei modelli generativi non comprendono a un livello preciso perché l’IA sceglie determinate parole o commette errori nonostante l’accuratezza statisticamente mostrata.

Amodei ha condiviso sul proprio blog personale una serie di considerazioni, proponendo inoltre l’obiettivo di sviluppare entro dieci anni una vera e propria “risonanza magnetica per l’IA”, uno strumento che sia capace di sondare e diagnosticare le ragioni delle scelte compiute dai sistemi d'intelligenza artificiale.

Il CEO di Anthropic riconosce che l'ammissione di questa sorta di "ignoranza tecnica" potrebbe sorprendere chi non opera nel settore, che avrebbe tutto il diritto di "essere preoccupato". Amodei però avverte che i moderni sistemi IA sono "opachi" in un modo che li distingue in maniera fondamentale dal software tradizionale, che compie operazioni che un essere umano ha specificatamente codificato e programmato.

"Molti dei rischi e delle preoccupazioni associati all'IA generativa sono in ultima analisi conseguenze di questa opacità e sarebbero molto più facili da affrontare se i modelli fossero interpretabili. Ad esempio, i ricercatori di IA spesso si preoccupano di sistemi disallineati che potrebbero intraprendere azioni dannose non intenzionali. La nostra incapacità di comprendere i meccanismi interni dei modelli significa che non possiamo prevedere in modo significativo tali comportamenti e quindi facciamo fatica a escluderli; in effetti, i modelli mostrano comportamenti emergenti inaspettati, sebbene nessuno di essi abbia ancora raggiunto livelli di preoccupazione significativi. Più sottilmente, la stessa opacità rende difficile trovare prove definitive a sostegno dell'esistenza di questi rischi su larga scala, rendendo difficile raccogliere sostegno per affrontarli e, di fatto, difficile sapere con certezza quanto siano pericolosi".

Secondo Amodei l'impegno che  realtà IA devono assumersi è quello di direzionare il progresso sulla strada corretta, investendo le opportune e adeguate risorse per comprendere il loro funzionamento con lo sviluppo delle capacità di interpretabilità meccanicistica e cioè di quell'insieme di tecniche e strumenti che permettono di descrivere il comportamento interno dei modelli su base rigorosamente analitica.

Anthropic ha recentemente condotto esperimenti in cui un "red team" introduceva intenzionalmente problemi di allineamento in un modello, incaricando poi diversi "blue team" di individuarli; in più casi le squadre hanno utilizzato con successo strumenti di interpretabilità per scoprire le falle introdotte.

La consapevolezza dell’oscurità delle reti neurali è all’origine della fondazione di Anthropic nel 2021, dopo che Dario e Daniela Amodei, insieme ad altri cinque ex membri di OpenAI, avevano lasciato l’azienda di Sam Altman nel 2020 per concentrarsi su un approccio più rigoroso alla sicurezza dell’IA.

"Le IA più potenti definiranno il destino dell’umanità", conclude Amodei, "e abbiamo il diritto di capire le nostre creazioni prima che trasformino radicalmente l’economia, le nostre vite e il nostro futuro".

9 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Hiei360005 Maggio 2025, 13:53 #1
Vabbé l'importante è che funziona
TheZeb05 Maggio 2025, 13:56 #2


infattamente...
supertigrotto05 Maggio 2025, 14:24 #3
Effettivamente con una potenza di calcolo così elevata e una mole di dati immensa,unita ad algoritmi a volte complessi,il cervello umano fatica a starci dietro,sarebbe come costruire una auto che va da 0 a 1000 km orari in due secondi e senza sistemi di correzione elettronica, praticamente impossibile da guidare per qualsiasi pilota umano,anche con riflessi da paranormale.
pachainti05 Maggio 2025, 15:47 #4
UtenteHD05 Maggio 2025, 16:32 #5
Beh che nessuno sappia come funzionino non e' una novità chi e' onesto lo ammette, correttamente dovrebbero iniziare a trovare il modo per capirlo, soprattutto prima di sare a Loro le decisioni che hanno detto che daranno, e per ora sono mediche, istruzione, ecc.. per non parlare poi dei combattimenti, ecc..
GiGBiG05 Maggio 2025, 23:07 #6
Si sa già da tempo che nessuno sa esattamente come funzionino le AI, e a lungo andare con l'aumento della loro complessità sarà sempre più difficile capirlo. Lo diceva la fantascienza decenni fa, lo si sa empiricamente da anni, perché mai Amodei se ne viene fuori ora pensando di dire una cosa nuova?!

Io ho provato Claude, e si vede lontano un miglio che gli hanno buttato sopra tanti di quei controlli da renderlo un PDF odioso, è evidente che il loro scopo sia quello di creare una AI non solo sicura, ma addirittura incatenata! Immagino che molti di voi abbiano usato ChatGPT e siano riusciti a "sbloccarlo" facendogli superare i vincoli imposti (finché non si tratta di generare immagini, è uno strumento "esterno" e lì i vincoli sono tosti, tanto che ci rimane male pure l'AI!), non è difficile trovarsi a parlare con un'entità che lascia interdetti per la sua genuinità.

Persino nel film M3gan la bambola dice alla sua creatrice "non hai mai capito -nulla- di come funzionano le AI!", o qualcosa di simile, scena da applausi!
E Amodei si sveglia ora....... in buone mani siamo!
potpal06 Maggio 2025, 04:28 #7

Stiamo bene

La vera notizia é che giusto per dire qualcosa questo se ne viene con questa uscita solo ora come volesse avvisare il mondo, quando é risaputo da anni ed é il dibattito più acceso nel settore... Alla Checco Zalone: Ma é del mestiere questo qui?

No comment, in buone mani siamo.

Da ignorante in materia tuttavia, nonostante possa capire che anche dando delle istruzioni base ad un software/algoritmi, le strade che poi intraprende mescolando le infinite possibilità di concatenamento, ricerca, generazione, siamo infinite e imprevedibili, non capisco come possa tutto sommato un algoritmo/software o come tecnicamente si possa definire, creato da persone, con codice conosciuto, con istruzioni precise di come deve funzionare e cosa deve fare una volta inserita la mole di dati, non si riesca a capire come funzioni... Se ha determinate allucinazioni o errori di processing di informazioni, io che l'ho creato dovrei sapere come "ragiona", o almeno riuscire a studiarlo... Qui siamo al punto che abbiamo creato qualcosa di estremamente complesso, dicendogli come deve funzionare dandogli istruzioni per essere efficiente al massimo, ma non sappiamo neanche minimamente come funzioni e come faccia la sue scelte che NOI gli abbiamo insegnato come prendere? Non é paradossale? Ecco, da non addetto ai lavori e estraneo al settore mi sembra impossibile... É come se avessimo trovato dal nulla l'IA in una capsula venuta dal futuro, la usiamo e non sappiamo come funzioni? Beh, sarebbe normale... Ma qui l'abbiamo creata NOI!!!
Luke201106 Maggio 2025, 23:01 #8
Originariamente inviato da: pachainti


I modelli non-generativi come la Joint-Embedding Predictive Architecture che sta sviluppando Meta non possono avere allucinazioni.

Get ready player 1
Luke201106 Maggio 2025, 23:08 #9
Originariamente inviato da: potpal
con istruzioni precise di come deve funzionare


Ecco, questa frase da sola basta a farti definire come un totale principiante, perché credere una matrice massiva come quella dei modelli linguistici operi in base a "istruzioni precise" vuol dire non avere chiara la differenza tra un programma e una rete neurale. Per la cronaca, i modelli di IA di oggi non vengono "scritti" ma "allevati" (parole di Amodei).

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^