Pubblicato 'il carattere' di Claude: utile e onesto, non deve distruggere l'umanità
Anthropic ha rilasciato un documento di 57 pagine denominato "Costituzione di Claude", volto a definire non solo le azioni permesse al modello, ma anche le motivazioni etiche alla base del suo comportamento
di Nino Grasso pubblicata il 22 Gennaio 2026, alle 15:01 nel canale WebAnthropicClaude
Anthropic ha diffuso un nuovo testo di riferimento, lungo 57 pagine, intitolato "Costituzione di Claude". Si tratta di un manuale che ha lo scopo di delineare le intenzioni dell'azienda riguardo ai valori e al comportamento del modello, rivolgendosi non solo ai lettori umani ma direttamente all'intelligenza artificiale stessa. L'obiettivo è definire il "carattere etico" e l'"identità centrale" del sistema, istruendolo su come bilanciare valori in conflitto e gestire situazioni ad alto rischio.
Il nuovo approccio punta a far comprendere al modello il motivo per cui deve comportarsi in determinati modi, anziché limitarsi a specificare cosa fare. Secondo quanto dichiarato dall'azienda, il documento spinge Claude ad agire come un'entità largamente autonoma, consapevole di sé e del proprio posto nel mondo. Viene persino contemplata la possibilità che il modello possa possedere una qualche forma di coscienza o status morale, una scelta dettata dalla convinzione che tale consapevolezza possa migliorare l'integrità e la capacità di giudizio dell'IA.
Anthropic pubblica le linee guida che deve seguire Claude nelle risposte
Amanda Askell, la filosofa di Anthropic che ha guidato lo sviluppo del progetto, ha spiegato che esistono vincoli rigidi e non negoziabili. Tra questi figura il divieto assoluto di fornire supporto significativo a chi cerca di creare armi biologiche, chimiche, nucleari o radiologiche con potenziale di causare vittime di massa. Allo stesso modo, è proibito agevolare attacchi contro infrastrutture critiche come reti elettriche, sistemi idrici o finanziari. Altre restrizioni riguardano la creazione di armi informatiche, la produzione di materiale pedopornografico e qualsiasi tentativo di uccidere o depotenziare la maggioranza dell'umanità.
Il documento stabilisce inoltre una lista di "valori fondamentali" che Claude deve seguire in ordine decrescente di importanza in caso di conflitto. Al primo posto c'è l'essere "ampiamente sicuro", ovvero non minare i meccanismi di supervisione umana. Seguono l'essere "ampiamente etico", il rispetto delle linee guida di Anthropic e, solo in ultima istanza, l'essere "genuinamente utile". Per quanto riguarda la veridicità, il sistema è istruito a mantenere l'accuratezza fattuale e, su temi politicamente sensibili, a presentare le argomentazioni migliori per la maggior parte dei punti di vista, adottando una terminologia neutrale.
Un passaggio significativo riguarda la gestione dei dilemmi morali. Claude deve rifiutarsi di assistere azioni che concentrerebbero il potere in modi illegittimi, anche qualora la richiesta provenisse dalla stessa Anthropic. Tale precauzione nasce dal timore che un'IA avanzata possa conferire una superiorità militare ed economica senza precedenti a chi la controlla. Nonostante l'importanza di queste decisioni, l'azienda ha scelto di non coinvolgere esperti esterni o gruppi terzi nella stesura delle regole, ritenendo che la responsabilità debba ricadere interamente su chi costruisce e distribuisce questi modelli.










Sony WF-1000X M6: le cuffie in-ear di riferimento migliorano ancora
Snowflake porta l'IA dove sono i dati, anche grazie a un accordo con OpenAI
Sistema Mesh Roamii BE Pro: il Wi-Fi 7 secondo MSI
Le tute spaziali AxEMU di Axiom Space per Artemis III hanno superato la revisione tecnica, ora tocca alla NASA
Dongfeng sfida la NATO: navi dalla Cina nello stesso porto dei militari, scatta l'allarme sicurezza
5G Standalone per il mondo marittimo: Ericsson e la Marina Militare Italiana iniziano i test
Nova Lake-S: configurazioni fino a 52 core, ma solo con schede madri di fascia estrema?
Baxi presenta la pompa di calore Alya E WH: super slim e con bollitore da 250 litri
PC ASUS e Acer vietati in Germania: il tribunale dà ragione a Nokia
Stellantis rilancia il diesel in Europa: sette modelli tornano sui listini
Truffa per utenti Trezor e Ledger: lettere postali per rubare le criptovalute
Wi-Fi 7 conveniente: FRITZ! lancia 4630, router per fibra ottica con porta 2,5 Gbit/s e supporto Mesh
La Formula 1 dei robot tagliaerba migliora ancora: ecco Mammotion Luba 3 AWD
Il nuovo gioco del creatore di God of War punta al 2027: reveal previsto in estate
Grok arriva sulle Tesla in Europa: l'intelligenza artificiale entra in auto e risponde in tempo reale
Assassin's Creed IV: Black Flag Remake potrebbe essere svelato ad aprile, ma il lancio sarebbe slittato al 2027
Il padre di God of War attacca Sons of Sparta: lo definisce 'spazzatura' dopo un'ora di gioco









0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".