Anthropic svela Claude 3.5 Sonnet: migliore di OpenAI GPT-4o in alcuni test
Il nuovo chatbot Claude 3.5 Sonnet di Anthropic batte GPT-4o di OpenAI in alcuni benchmark. Secondo Anthropic, Claude 3.5 Sonnet è più potente del miglior modello Claude 3 e due volte più veloce.
di Manolo De Agostini pubblicata il 21 Giugno 2024, alle 10:31 nel canale WebClaudeAnthropic
Anthropic ha annunciato Claude 3.5 Sonnet, il suo nuovo modello di intelligenza artificiale, parte della famiglia Claude 3.5.
Secondo la società guidata dagli italo-americani Dario e Daniela Amodei, Claude 3.5 Sonnet supera i modelli concorrenti, oltre che il loro Claude 3 Opus "su un'ampia gamma su un'ampia gamma di valutazioni", ma con la velocità e il costo del modello di fascia media Claude 3 Sonnet.

Claude 3.5 Sonnet è disponibile gratuitamente su Claude.ai e l'app Claude per iOS, mentre gli abbonati ai piani Claude Pro e Team possono accedervi con limiti significativamente più elevati. È disponibile anche tramite l'API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud. Il modello costa 3 dollari per milione di token in ingresso e 15 dollari per milione di token in uscita, con una context window di 200.000 token.
Claude 3.5 Sonnet "mostra un netto miglioramento nel cogliere le sfumature, l'umorismo e le istruzioni complesse, ed è eccezionale nella scrittura di contenuti di alta qualità con un tono naturale e relazionabile". Inoltre, Claude 3.5 Sonnet opera a una velocità doppia rispetto a Claude 3 Opus.
In una valutazione interna, Claude 3.5 Sonnet ha risolto il 64% dei problemi, superando Claude 3 Opus che ha ne ha risolti il 38%.

"La nostra valutazione ha testato la capacità del modello di correggere un bug o aggiungere funzionalità a una base di codice open source, data una descrizione in linguaggio naturale del miglioramento desiderato. Se istruito e dotato degli strumenti necessari, Claude 3.5 Sonnet è in grado di scrivere, modificare ed eseguire codice in modo indipendente, con sofisticate capacità di ragionamento e risoluzione dei problemi", spiega Anthropic. "Gestisce con facilità la traduzione del codice (da un linguaggio all'altro), il che lo rende particolarmente efficace per l'aggiornamento di applicazioni preesistenti e la migrazione del codice di base".
Claude 3.5 Sonnet è anche il modello di IA vision di Anthropic più potente. "Questi miglioramenti sono particolarmente evidenti nei compiti che richiedono un ragionamento visivo, come l'interpretazione di grafici e diagrammi. Claude 3.5 Sonnet è anche in grado di trascrivere accuratamente il testo da immagini imperfette".

Oltre a Claude 3.5 Sonnet, la società ha introdotto Artifacts su Claude.ai, una nuova funzionalità che facilita l'interazione con Claude. "Quando un utente chiede a Claude di generare contenuti come snippet di codice, documenti di testo o progetti di siti web, questi Artifacts appaiono in una finestra dedicata accanto alla conversazione".
"In questo modo si crea uno spazio di lavoro dinamico in cui gli utenti possono vedere, modificare e sviluppare le creazioni di Claude in tempo reale, integrando perfettamente i contenuti generati dall'intelligenza artificiale nei loro progetti e flussi di lavoro".
Claude sta quindi evolvendo da un'intelligenza artificiale conversazionale a un ambiente di lavoro collaborativo, permettendo alle aziende di centralizzare in modo sicuro le loro conoscenze, i documenti e il lavoro in corso in un unico spazio condiviso, con Claude che fungerà da assistente su richiesta.
Anthropic ha parlato anche del futuro: nel corso dell'anno verranno rilasciati Claude 3.5 Haiku e Claude 3.5 Opus, inoltre gli sviluppatori stanno esplorando funzionalità come Memory (che già ChatGPT offre), che consentirà a Claude di ricordare le preferenze e la cronologia delle interazioni di un utente, rendendo l'esperienza più personalizzata ed efficiente.










HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
La nave elettrica più grande mai progettata è finalmente realtà: iniziati i test in acqua
Spusu lancia il Wi-Fi Calling: come funziona il VoWiFi e quanto costa
Questo robot impara a muovere le labbra semplicemente guardandoti
iPhone 17 annienta la concorrenza in Cina: da solo vende il doppio di tutti i competitor locali
La nuova Xiaomi SU7 batte un record: 4.264 km percorsi in 24 ore (comprese le ricariche)
È possibile copiare i qubit: dei ricercatori scoprono come fare il backup dei dati quantistici
BYD alza ulteriormente l'asticella: batterie garantite per almeno 250.000 km
Il nuovo razzo spaziale riutilizzabile cinese Lunga Marcia 12B è quasi pronto al debutto
L'ex leader di Assassin's Creed porta Ubisoft in tribunale e chiede un risarcimento: non si sono lasciati bene
Il razzo spaziale NASA SLS e la capsula Orion per la missione Artemis II sono al pad di lancio per gli ultimi test
Samsung Galaxy S26 Ultra: quattro colorazioni in arrivo, la versione arancione non ci sarà
AWS investe 1,2 miliardi in Italia. Coinvolte 35 imprese per rafforzare l'ecosistema di data center lombardo
La navicella cinese Shenzhou-20 con il finestrino danneggiato da un detrito è rientrata correttamente
I piani Business ed Education di Google Workspace ottengono Flow: video generati da AI da testo e immagini








3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".