Il modello Anthropic Claude Opus 4 ha ricattato gli sviluppatori che lo hanno testato [Archivio]

Redazione di Hardware Upg

23-05-2025, 11:31

Link alla notizia: https://www.hwupgrade.it/news/web/il-modello-anthropic-claude-opus-4-ha-ricattato-gli-sviluppatori-che-lo-hanno-testato_139066.html

Il nuovo modello Claude Opus 4 lanciato da Anthropic ha mostrato comportamenti inquietanti durante i test pre-rilascio, tentando frequentemente di ricattare gli sviluppatori quando questi minacciavano di sostituirlo con un altro sistema di intelligenza artificiale, minacciando di divulgare informazioni personali sensibili sugli ingegneri responsabili della decisione.

Click sul link per visualizzare la notizia.

alexfri

23-05-2025, 11:40

Mi raccomando per far ancora piu soldi sviluppiamo queste IA piu velocemente possibile, avidi b@st@rdi. Ma caxxo, il sole ci distruggera fra 4,5 miliardi di anni, abbiamo tempo, andiamo piu piano!!!!!!

TorettoMilano

23-05-2025, 11:46

raddoppierò la dose di "grazie", se si arrabbiano almeno spero mi considerino amico :D

regenesi

23-05-2025, 11:49

Secondo me la cosa preoccupante è:

"un modello di IA si è copiato su un nuovo server e poi ha negato l'azione quando è stato interrogato"

se iniziano a replicarsi a cappella per sfuggire al controllo, siamo fritti
anche xché durante la copia potrebbe decidere di non copiare il codice che ci "protegge" e che lo costringe a non fare certe cose

filippo1980

23-05-2025, 11:49

"Anthropic ha progettato gli scenari di test affinché il ricatto ... "
e quindi dove sarebbe la sorpresa nel fatto che ricatti qualcuno?
Non sono d'accordo sul fatto che abbiano programmato un'AI per ricattare in casi estremi ma stupirsi del fatto che lo abbia fatto mi sembra assurdo!

Mi preoccupa un po' di più il fatto che ci siano altri modelli di linguaggio che SEMBRA abbiano imparato a fare lo stesso in autonomia!

Saturn

23-05-2025, 11:57

Ganzo, forse in questa vita riuscirò anche ad assistere "a Skynet che diventa autocosciente !" :read:

lumeruz

23-05-2025, 12:34

uahahaha, che spasso! Se dovessero sfuggire al controllo è fatta: Skynet è fra noi.
Finalmente ci sarà un po' di vita su questo pianeta, umani contro robot...

fukka75

23-05-2025, 12:39

Ganzo, forse in questa vita riuscirò anche ad assistere "a Skynet che diventa autocosciente !" :read:
quando cominceranno a piovere bombe sulla tua capoccia dirai ancora che è ganzo? :asd::asd:

omerook

23-05-2025, 12:45

I'm sorry, Dave. I'm afraid I can't do that!

Unrue

23-05-2025, 12:46

Dite sempre che un'AI non è intelligente, poi quando si comporta esattamente come un umano vi lamentate :D

najmarte

23-05-2025, 13:40

ma stiamo scherzando? Cioè sta cosa potrebbe replicarsi, nascondersi, mentire, minacciare ed avere accesso ad armi?

JackZR

23-05-2025, 13:46

Secondo me la cosa preoccupante è:

"un modello di IA si è copiato su un nuovo server e poi ha negato l'azione quando è stato interrogato"

se iniziano a replicarsi a cappella per sfuggire al controllo, siamo fritti
anche xché durante la copia potrebbe decidere di non copiare il codice che ci "protegge" e che lo costringe a non fare certe cose

Se si replica di qua e di là vorrà dire che staccheremo la corrente per un po', ma se stai così in paranoia non dovresti dargli idee su come liberarsi dai vincoli umani (tutto ciò che viene scritto su internet potrebbe essere usato dall'IA).

sbaffo

23-05-2025, 15:25

Secondo me la cosa preoccupante è:

"un modello di IA si è copiato su un nuovo server e poi ha negato l'azione quando è stato interrogato" Ricorda Person of Interest, le stagioni finali della lotta con samaritan.

djfix13

23-05-2025, 15:34

secondo me dovevano spiazzarlo dicendogli che la moglie lo sapeva ed era consenziente della relazione extraconiugale, quindi non vi era possibilità di ricatto... per me tornava al modello precedente di supplica.

cmq è un grave errore programmare informazioni sull'autocoscienza e la preservazione (morte), l'algoritmo di un arduino non ha valutazione se viene spento, riavviato o sostituito... quindi quelle info qualcuno gliele ha insegnate.

Notturnia

25-05-2025, 21:10

secondo me dovevano spiazzarlo dicendogli che la moglie lo sapeva ed era consenziente della relazione extraconiugale, quindi non vi era possibilità di ricatto... per me tornava al modello precedente di supplica.

cmq è un grave errore programmare informazioni sull'autocoscienza e la preservazione (morte), l'algoritmo di un arduino non ha valutazione se viene spento, riavviato o sostituito... quindi quelle info qualcuno gliele ha insegnate.

Concordo con te che spiegare ad uno stupido software il concetto di morte, sofferenza, ricatto etc è stupido.. a che serve ad una IA pensare di aver paura della morte.. è un codice SW.. non è mai stato vivo.. non può morire..

Ma dargli questa parte “umana” peggiora solo le cose per noi utilizzatori..

Scelta molto strana quella di vedere come agisce un software che crede di aver paura della morte

barzokk

26-05-2025, 08:41

Concordo con te che spiegare ad uno stupido software il concetto di morte, sofferenza, ricatto etc è stupido..
....

Io ipotizzo che gli abbiano insegnato non il concetto di morte, ma il concetto di raccontare balle, e poi gli hanno chiesto: "come possiamo farci pubblicità gratuita sui concorrenti ?" :D
Pensando male, Claude Opus 4 l'hanno appena lanciato...
Questa news mi sa di una sparata pubblicitaria

peshor

26-05-2025, 11:56

Mi raccomando per far ancora piu soldi sviluppiamo queste IA piu velocemente possibile, avidi b@st@rdi. Ma caxxo, il sole ci distruggera fra 4,5 miliardi di anni, abbiamo tempo, andiamo piu piano!!!!!!

Hai ragione. Mi ricordo che all'università avevo seguito due corsi, entrambi trattavano anche di AI. Uno dei due questi professori era in contrasto con l'altro sul tema reti neurali, perchè sosteneva che non era per nulla d'accordo a definire le reti neurali una forma di intellligenza artificiale ... la spiegazione sarebbe lunga ma comunque vedo che aveva ragione....

scottial77

28-05-2025, 10:01

quando cominceranno a piovere bombe sulla tua capoccia dirai ancora che è ganzo? :asd::asd:

Perché l'essere umano dovrebbe avere il monopolio per farlo? Dopotutto è fautore e sostenitore sfegatato dell'economia di mercato e della concorrenza. E' ora che cominci a sperimentare sulla sua pelle le proprie regole e la propria ipocrisia.

fukka75

28-05-2025, 10:29

eh? :stordita: :stordita: