Anthropic alza l’asticella: Claude Opus 4.6 arriva con 1 milione di token di contesto

Anthropic ha annunciato Claude Opus 4.6, evoluzione del suo modello di punta, con significative prestazioni nell'esecuzione di compiti complessi come analisi finanziarie e gestione di codebase estese, mantenendo un profilo di sicurezza elevato

di Andrea Bai pubblicata il 06 Febbraio 2026, alle 08:53 nel canale Web
Anthropic Claude

Anthropic ha annunciato Claude Opus 4.6, il nuovo modello che segna un miglioramento netto rispetto a Opus 4.5, soprattutto nella capacità di pianificare in modo più preciso, di portare avanti compiti agentici complessi e di lunga durata (cioè task che richiedono più passaggi, memoria dello stato e decisioni coerenti nel tempo) e di lavorare in modo affidabile su codebase molto grandi.

Una delle novità principali è l’introduzione, in beta, di una finestra di contesto da 1 milione di token: è la prima volta che questa capacità arriva nella linea Opus. In pratica, il modello può leggere e mantenere in memoria quantità enormi di informazioni senza perdere il filo. Questa stabilità su contesti estremamente estesi è supportata dai risultati nel benchmark MRCR v2, dove Opus 4.6 raggiunge il 76% di accuratezza anche a 1 milione di token, indicando una degradazione minima delle prestazioni.

Migliorano anche le capacità di code review e debugging, con il modello in grado di identificare autonomamente i propri errori. Nuove funzionalità API includono il context compaction per task lunghi, adaptive thinking per ragionare in modo contestuale e controlli di effort su quattro livelli per bilanciare intelligenza, velocità e costi.

Prestazioni nei benchmark

Opus 4.6 è riuscito a primeggiare in diversi test, stando a quanto dichiarato da Anthropic: raggiunge il punteggio più alto su Terminal-Bench 2.0 per coding agentico, supera tutti i concorrenti su Humanity’s Last Exam e GDPval-AA, dove eccelle di 144 Elo punti su GPT-5.2 e 190 sul predecessore. Su BrowseComp misura la ricerca online complessa, mentre su ARC AGI 2 segna il 68,8%, un balzo dell'83% rispetto a Opus 4.5.

In ambito enterprise, domina Finance Agent con il 60,7% e OSWorld per uso computerizzato al 72,7%. Test interni confermano anche un valido comportamento in compiti legati alla cybersecurity, con oltre 500 vulnerabilità zero-day scoperte in librerie open-source.

Integrazioni e disponibilità

Disponibile da oggi su claude.ai, API e piattaforme cloud come Amazon Bedrock e Microsoft Foundry, con prezzo invariato a 5/25 dollari per milione di token input/output. Nuove feature prodotto comprendono agent team in Claude Code per lavoro parallelo e integrazioni avanzate con Excel e PowerPoint in preview.

Anthropic afferma che il modello presenta un livello di sicurezza pari o superiore a quello dei cosiddetti frontier model. I test mostrano bassi tassi di comportamenti disallineati (cioè risposte che deviano dagli obiettivi di sicurezza) e una riduzione delle over-refusals, ovvero i rifiuti eccessivamente cauti anche quando la richiesta è legittima.
Le valutazioni di sicurezza sono state ampie e sistematiche, includendo aree come la deception (capacità di ingannare), la sycophancy (tendenza a compiacere l’utente anche quando ha torto) e il misuse (uso improprio del modello). A supporto, Anthropic ha integrato safeguard specifici per la cybersecurity e strumenti di interpretability research, utili a osservare e monitorare i comportamenti interni del modello, non solo gli output finali.

I migliori sconti su Amazon oggi

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

44.90€ Compra ora

ECOVACS DEEBOT T50 PRO OMNI Gen2 Robot Aspirapolvere Lavapavimenti, (Migliorato da T30 PRO), 21000 Pa, Spazzola Laterale Estensibile e Lavapavimenti, Aggiunta Automatica Soluzione Detergente

499.00€ Compra ora

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

Lefant al contrattacco su Amazon: tre robot aspirapolvere in offerta, da 129€ al top con stazione smart

Poker di Bethesda al Nintendo Direct: Indiana Jones, Fallout 4, Skyrim e Oblivion Remastered su Switch 2

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

ASUS ROG CROSSHAIR X870E GLACIAL

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless MSI FORGE GK600 TKL WIRELESS: switch lineari hot-swap, tripla connettività, display LCD e 5 strati di fonoassorbimento. Ottima in gaming, a 79,99 euro

Recensione Xiaomi Pad 8 Pro: potenza bruta e HyperOS 3 per sfidare la fascia alta Xiaomi Pad 8 Pro adotta il potente Snapdragon 8 Elite all'interno di un corpo con spessore di soli 5,75 mm e pannello LCD a 144Hz flicker-free, per un tablet che...

WoW: Midnight, Blizzard mette il primo, storico mattone per l'housing e molto altro Con Midnight, Blizzard tenta il colpaccio: il player housing sbarca finalmente su Azeroth insieme a una Quel'Thalas ricostruita da zero. Tra il dramma della famiglia...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Nutanix cambia pelle: dall’iperconvergenza alla piattaforma full stack per cloud ibrido e IA Al .NEXT 2026 di Chicago, Nutanix ha mostrato quanto sia cambiata: una piattaforma software che gestisce VM, container e carichi di lavoro IA ovunque, dall’on-premise...

Zeekr X e 7X provate: prezzi, autonomia fino a 615 km e ricarica in 13 minuti Zeekr sbarca ufficialmente in Italia con tre modelli elettrici premium, X, 7X e 001, distribuiti da Jameel Motors su una rete di 52 punti vendita già attivi. La...

Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato Nuova frontiera per i robot tagliaerba, con Ecovacs GOAT O1200 LiDAR Pro che riconosce l'ambiente in maniera perfetta, grazie a due sensori LiDAR, e dopo la falciatura...