Hardware Upgrade Forum - View Single Post - Il modello Anthropic Claude Opus 4 ha ricattato gli sviluppatori che lo hanno testato

filippo1980 · 23-05-2025, 11:49

"Anthropic ha progettato gli scenari di test affinché il ricatto ... "
e quindi dove sarebbe la sorpresa nel fatto che ricatti qualcuno?
Non sono d'accordo sul fatto che abbiano programmato un'AI per ricattare in casi estremi ma stupirsi del fatto che lo abbia fatto mi sembra assurdo!

Mi preoccupa un po' di più il fatto che ci siano altri modelli di linguaggio che SEMBRA abbiano imparato a fare lo stesso in autonomia!

23-05-2025, 11:49	#5
filippo1980 Senior Member Iscritto dal: Jan 2009 Messaggi: 836	"Anthropic ha progettato gli scenari di test affinché il ricatto ... " e quindi dove sarebbe la sorpresa nel fatto che ricatti qualcuno? Non sono d'accordo sul fatto che abbiano programmato un'AI per ricattare in casi estremi ma stupirsi del fatto che lo abbia fatto mi sembra assurdo! Mi preoccupa un po' di più il fatto che ci siano altri modelli di linguaggio che SEMBRA abbiano imparato a fare lo stesso in autonomia!