View Full Version : Il modello Anthropic Claude Opus 4 ha ricattato gli sviluppatori che lo hanno testato
Redazione di Hardware Upg
23-05-2025, 10:31
Link alla notizia: https://www.hwupgrade.it/news/web/il-modello-anthropic-claude-opus-4-ha-ricattato-gli-sviluppatori-che-lo-hanno-testato_139066.html
Il nuovo modello Claude Opus 4 lanciato da Anthropic ha mostrato comportamenti inquietanti durante i test pre-rilascio, tentando frequentemente di ricattare gli sviluppatori quando questi minacciavano di sostituirlo con un altro sistema di intelligenza artificiale, minacciando di divulgare informazioni personali sensibili sugli ingegneri responsabili della decisione.
Click sul link per visualizzare la notizia.
Mi raccomando per far ancora piu soldi sviluppiamo queste IA piu velocemente possibile, avidi b@st@rdi. Ma caxxo, il sole ci distruggera fra 4,5 miliardi di anni, abbiamo tempo, andiamo piu piano!!!!!!
TorettoMilano
23-05-2025, 10:46
raddoppierò la dose di "grazie", se si arrabbiano almeno spero mi considerino amico :D
regenesi
23-05-2025, 10:49
Secondo me la cosa preoccupante è:
"un modello di IA si è copiato su un nuovo server e poi ha negato l'azione quando è stato interrogato"
se iniziano a replicarsi a cappella per sfuggire al controllo, siamo fritti
anche xché durante la copia potrebbe decidere di non copiare il codice che ci "protegge" e che lo costringe a non fare certe cose
filippo1980
23-05-2025, 10:49
"Anthropic ha progettato gli scenari di test affinché il ricatto ... "
e quindi dove sarebbe la sorpresa nel fatto che ricatti qualcuno?
Non sono d'accordo sul fatto che abbiano programmato un'AI per ricattare in casi estremi ma stupirsi del fatto che lo abbia fatto mi sembra assurdo!
Mi preoccupa un po' di più il fatto che ci siano altri modelli di linguaggio che SEMBRA abbiano imparato a fare lo stesso in autonomia!
Ganzo, forse in questa vita riuscirò anche ad assistere "a Skynet che diventa autocosciente !" :read:
uahahaha, che spasso! Se dovessero sfuggire al controllo è fatta: Skynet è fra noi.
Finalmente ci sarà un po' di vita su questo pianeta, umani contro robot...
Ganzo, forse in questa vita riuscirò anche ad assistere "a Skynet che diventa autocosciente !" :read:
quando cominceranno a piovere bombe sulla tua capoccia dirai ancora che è ganzo? :asd::asd:
I'm sorry, Dave. I'm afraid I can't do that!
Dite sempre che un'AI non è intelligente, poi quando si comporta esattamente come un umano vi lamentate :D
najmarte
23-05-2025, 12:40
ma stiamo scherzando? Cioè sta cosa potrebbe replicarsi, nascondersi, mentire, minacciare ed avere accesso ad armi?
Secondo me la cosa preoccupante è:
"un modello di IA si è copiato su un nuovo server e poi ha negato l'azione quando è stato interrogato"
se iniziano a replicarsi a cappella per sfuggire al controllo, siamo fritti
anche xché durante la copia potrebbe decidere di non copiare il codice che ci "protegge" e che lo costringe a non fare certe cose
Se si replica di qua e di là vorrà dire che staccheremo la corrente per un po', ma se stai così in paranoia non dovresti dargli idee su come liberarsi dai vincoli umani (tutto ciò che viene scritto su internet potrebbe essere usato dall'IA).
Secondo me la cosa preoccupante è:
"un modello di IA si è copiato su un nuovo server e poi ha negato l'azione quando è stato interrogato" Ricorda Person of Interest, le stagioni finali della lotta con samaritan.
secondo me dovevano spiazzarlo dicendogli che la moglie lo sapeva ed era consenziente della relazione extraconiugale, quindi non vi era possibilità di ricatto... per me tornava al modello precedente di supplica.
cmq è un grave errore programmare informazioni sull'autocoscienza e la preservazione (morte), l'algoritmo di un arduino non ha valutazione se viene spento, riavviato o sostituito... quindi quelle info qualcuno gliele ha insegnate.
Notturnia
25-05-2025, 20:10
secondo me dovevano spiazzarlo dicendogli che la moglie lo sapeva ed era consenziente della relazione extraconiugale, quindi non vi era possibilità di ricatto... per me tornava al modello precedente di supplica.
cmq è un grave errore programmare informazioni sull'autocoscienza e la preservazione (morte), l'algoritmo di un arduino non ha valutazione se viene spento, riavviato o sostituito... quindi quelle info qualcuno gliele ha insegnate.
Concordo con te che spiegare ad uno stupido software il concetto di morte, sofferenza, ricatto etc è stupido.. a che serve ad una IA pensare di aver paura della morte.. è un codice SW.. non è mai stato vivo.. non può morire..
Ma dargli questa parte “umana” peggiora solo le cose per noi utilizzatori..
Scelta molto strana quella di vedere come agisce un software che crede di aver paura della morte
Concordo con te che spiegare ad uno stupido software il concetto di morte, sofferenza, ricatto etc è stupido..
....
Io ipotizzo che gli abbiano insegnato non il concetto di morte, ma il concetto di raccontare balle, e poi gli hanno chiesto: "come possiamo farci pubblicità gratuita sui concorrenti ?" :D
Pensando male, Claude Opus 4 l'hanno appena lanciato...
Questa news mi sa di una sparata pubblicitaria
Mi raccomando per far ancora piu soldi sviluppiamo queste IA piu velocemente possibile, avidi b@st@rdi. Ma caxxo, il sole ci distruggera fra 4,5 miliardi di anni, abbiamo tempo, andiamo piu piano!!!!!!
Hai ragione. Mi ricordo che all'università avevo seguito due corsi, entrambi trattavano anche di AI. Uno dei due questi professori era in contrasto con l'altro sul tema reti neurali, perchè sosteneva che non era per nulla d'accordo a definire le reti neurali una forma di intellligenza artificiale ... la spiegazione sarebbe lunga ma comunque vedo che aveva ragione....
scottial77
28-05-2025, 09:01
quando cominceranno a piovere bombe sulla tua capoccia dirai ancora che è ganzo? :asd::asd:
Perché l'essere umano dovrebbe avere il monopolio per farlo? Dopotutto è fautore e sostenitore sfegatato dell'economia di mercato e della concorrenza. E' ora che cominci a sperimentare sulla sua pelle le proprie regole e la propria ipocrisia.
eh? :stordita: :stordita:
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.