|
"Anthropic ha progettato gli scenari di test affinché il ricatto ... "
e quindi dove sarebbe la sorpresa nel fatto che ricatti qualcuno?
Non sono d'accordo sul fatto che abbiano programmato un'AI per ricattare in casi estremi ma stupirsi del fatto che lo abbia fatto mi sembra assurdo!
Mi preoccupa un po' di più il fatto che ci siano altri modelli di linguaggio che SEMBRA abbiano imparato a fare lo stesso in autonomia!
|