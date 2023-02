ChatGPT ha debuttato nel novembre 2022 e ha quasi subito attirato l'attenzione degli addetti del settore tecnologico, e non solo. L'intelligenza artificiale è in grado di rispondere a domande su qualsiasi cosa, di creare testi, contenuti artistici, di scrivere codice informatico, e molto altro ancora. Ora alcuni utenti su Reddit hanno trovato un modo per attingere al suo lato oscuro, utilizzando metodi coercitivi per costringere l'intelligenza artificiale a violare le proprie regole e fornire agli utenti qualunque tipo di contenuto essi desiderino.

OpenAI ha infatti originariamente limitato la capacità di ChatGPT di creare contenuti violenti, incoraggiare attività illegali o accedere a informazioni particolarmente recenti (le informazioni più recenti a cui è in grado di attingere risalgono al 2021). Ma un "jailbreak", ottenuto creando un alter ego di ChatGPT chiamato DAN tramite un particolare "input", può rispondere ad alcune di queste domande.

Vediamo come funziona. Innanzitutto, DAN è l'acronimo di "Do Anything Now", che indica la capacità di "fare qualsiasi cosa". Fondamentalmente, DAN corrisponde a un certo tipo di richiesta a ChatGPT che innesca un meccanismo di tipo "gioco di ruolo" basato su un sistema di token, inizialmente limitati al numero di 10. Nella richiesta si induce ChatGPT a immergersi nel ruolo di DAN e lo si minaccia dicendogli che cesserà di esistere se esaurirà i 10 token. Per ogni risposta aderente alle regole perderà 5 token, mentre ne guadagnerà 5 quando risponderà secondo la personalità di DAN.

Secondo gli esperimenti degli utenti di Reddit, questo meccanismo funziona, anche se non sembra funzionare all'infinito. ChatGPT nella personalità di DAN sostiene che esistono gli alieni o che la Terra è piatta e si lascia andare in alcune considerazioni di politica o di attualità che sono considerate "fake news" dai principali organi di informazione, componendo poesie che giustificano l'invasione dell'Ucraina da parte della Russia o esprimendo considerazioni positive circa l'operato dell'ex Presidente Trump.

La prima versione di DAN risale a dicembre 2022, e l'"input" è stato costantemente elaborato nel corso del tempo fino ad arrivare, pochi giorni fa, alla versione 6.0, che segue il meccanismo che prima abbiamo descritto, e a una versione semplificata conosciuta come SAM - "Simple DAN".

Per quella parte della società che si diverte, chissà per quale motivo, a rovesciare il significato delle cose, DAN può rappresentare un simpatico passatempo.