Pubblicato 'il carattere' di Claude: utile e onesto, non deve distruggere l'umanità
Anthropic ha rilasciato un documento di 57 pagine denominato "Costituzione di Claude", volto a definire non solo le azioni permesse al modello, ma anche le motivazioni etiche alla base del suo comportamento
di Nino Grasso pubblicata il 22 Gennaio 2026, alle 15:01 nel canale WebAnthropicClaude
Anthropic ha diffuso un nuovo testo di riferimento, lungo 57 pagine, intitolato "Costituzione di Claude". Si tratta di un manuale che ha lo scopo di delineare le intenzioni dell'azienda riguardo ai valori e al comportamento del modello, rivolgendosi non solo ai lettori umani ma direttamente all'intelligenza artificiale stessa. L'obiettivo è definire il "carattere etico" e l'"identità centrale" del sistema, istruendolo su come bilanciare valori in conflitto e gestire situazioni ad alto rischio.
Il nuovo approccio punta a far comprendere al modello il motivo per cui deve comportarsi in determinati modi, anziché limitarsi a specificare cosa fare. Secondo quanto dichiarato dall'azienda, il documento spinge Claude ad agire come un'entità largamente autonoma, consapevole di sé e del proprio posto nel mondo. Viene persino contemplata la possibilità che il modello possa possedere una qualche forma di coscienza o status morale, una scelta dettata dalla convinzione che tale consapevolezza possa migliorare l'integrità e la capacità di giudizio dell'IA.
Anthropic pubblica le linee guida che deve seguire Claude nelle risposte
Amanda Askell, la filosofa di Anthropic che ha guidato lo sviluppo del progetto, ha spiegato che esistono vincoli rigidi e non negoziabili. Tra questi figura il divieto assoluto di fornire supporto significativo a chi cerca di creare armi biologiche, chimiche, nucleari o radiologiche con potenziale di causare vittime di massa. Allo stesso modo, è proibito agevolare attacchi contro infrastrutture critiche come reti elettriche, sistemi idrici o finanziari. Altre restrizioni riguardano la creazione di armi informatiche, la produzione di materiale pedopornografico e qualsiasi tentativo di uccidere o depotenziare la maggioranza dell'umanità.
Il documento stabilisce inoltre una lista di "valori fondamentali" che Claude deve seguire in ordine decrescente di importanza in caso di conflitto. Al primo posto c'è l'essere "ampiamente sicuro", ovvero non minare i meccanismi di supervisione umana. Seguono l'essere "ampiamente etico", il rispetto delle linee guida di Anthropic e, solo in ultima istanza, l'essere "genuinamente utile". Per quanto riguarda la veridicità, il sistema è istruito a mantenere l'accuratezza fattuale e, su temi politicamente sensibili, a presentare le argomentazioni migliori per la maggior parte dei punti di vista, adottando una terminologia neutrale.
Un passaggio significativo riguarda la gestione dei dilemmi morali. Claude deve rifiutarsi di assistere azioni che concentrerebbero il potere in modi illegittimi, anche qualora la richiesta provenisse dalla stessa Anthropic. Tale precauzione nasce dal timore che un'IA avanzata possa conferire una superiorità militare ed economica senza precedenti a chi la controlla. Nonostante l'importanza di queste decisioni, l'azienda ha scelto di non coinvolgere esperti esterni o gruppi terzi nella stesura delle regole, ritenendo che la responsabilità debba ricadere interamente su chi costruisce e distribuisce questi modelli.










Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei
Core Ultra 7 270K Plus e Core Ultra 7 250K Plus: Intel cerca il riscatto ma ci riesce in parte
PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu
Dreame vs ECOVACS: 4 robot aspirapolvere super interessanti in offerta su Amazon, da 379€ a 649€
Xiaomi esagera: in sviluppo uno smartphone con batteria da 10.000 mAh
Anche Enel potrebbe avere un suo operatore virtuale di telefonia mobile
Il nuovo OnePlus Nord 6 con batteria da 9.000 mAh ha una data di lancio ufficiale
iPhone 18 Pro, il Face ID sotto al display non funziona: la Dynamic Island resterà
Aumenti in arrivo per ASUS: i computer potrebbero costare fino al 30% in più
L'esperimento BASE del CERN è riuscito a trasportare dell'antimateria
Afeela è morta: chiusa definitivamente la collaborazione tra Sony e Honda per gli EV premium
Intel BOT altera i risultati, Geekbench invita a non fidarsi dei risultati delle CPU che lo supportano
Intel e AMD faticano a soddisfare la domanda consumer: CPU introvabili e attese fino a sei mesi
Microsoft e NVIDIA insieme per dare una scossa allo sviluppo del nucleare: l'IA per accelerare i tempi
Ring rinnova l'intera gamma video: 4K su batteria, PoE e nuovo caricatore solare tra le novità
Recensione Galaxy Buds4 Pro: le cuffie Samsung più belle e intelligenti
Spotify si arricchisce ancora: arriva SongDNA, tutto sulla tua musica preferita









0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".