Anthropic svela Claude 3.5 Sonnet: migliore di OpenAI GPT-4o in alcuni test

Anthropic svela Claude 3.5 Sonnet: migliore di OpenAI GPT-4o in alcuni test

Il nuovo chatbot Claude 3.5 Sonnet di Anthropic batte GPT-4o di OpenAI in alcuni benchmark. Secondo Anthropic, Claude 3.5 Sonnet è più potente del miglior modello Claude 3 e due volte più veloce.

di pubblicata il , alle 10:31 nel canale Web
ClaudeAnthropic
 

Anthropic ha annunciato Claude 3.5 Sonnet, il suo nuovo modello di intelligenza artificiale, parte della famiglia Claude 3.5.

Secondo la società guidata dagli italo-americani Dario e Daniela Amodei, Claude 3.5 Sonnet supera i modelli concorrenti, oltre che il loro Claude 3 Opus "su un'ampia gamma su un'ampia gamma di valutazioni", ma con la velocità e il costo del modello di fascia media Claude 3 Sonnet.

Claude 3.5 Sonnet è disponibile gratuitamente su Claude.ai e l'app Claude per iOS, mentre gli abbonati ai piani Claude Pro e Team possono accedervi con limiti significativamente più elevati. È disponibile anche tramite l'API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud. Il modello costa 3 dollari per milione di token in ingresso e 15 dollari per milione di token in uscita, con una context window di 200.000 token.

Claude 3.5 Sonnet "mostra un netto miglioramento nel cogliere le sfumature, l'umorismo e le istruzioni complesse, ed è eccezionale nella scrittura di contenuti di alta qualità con un tono naturale e relazionabile". Inoltre, Claude 3.5 Sonnet opera a una velocità doppia rispetto a Claude 3 Opus.

In una valutazione interna, Claude 3.5 Sonnet ha risolto il 64% dei problemi, superando Claude 3 Opus che ha ne ha risolti il 38%.

"La nostra valutazione ha testato la capacità del modello di correggere un bug o aggiungere funzionalità a una base di codice open source, data una descrizione in linguaggio naturale del miglioramento desiderato. Se istruito e dotato degli strumenti necessari, Claude 3.5 Sonnet è in grado di scrivere, modificare ed eseguire codice in modo indipendente, con sofisticate capacità di ragionamento e risoluzione dei problemi", spiega Anthropic. "Gestisce con facilità la traduzione del codice (da un linguaggio all'altro), il che lo rende particolarmente efficace per l'aggiornamento di applicazioni preesistenti e la migrazione del codice di base".

Claude 3.5 Sonnet è anche il modello di IA vision di Anthropic più potente. "Questi miglioramenti sono particolarmente evidenti nei compiti che richiedono un ragionamento visivo, come l'interpretazione di grafici e diagrammi. Claude 3.5 Sonnet è anche in grado di trascrivere accuratamente il testo da immagini imperfette".

Oltre a Claude 3.5 Sonnet, la società ha introdotto Artifacts su Claude.ai, una nuova funzionalità che facilita l'interazione con Claude. "Quando un utente chiede a Claude di generare contenuti come snippet di codice, documenti di testo o progetti di siti web, questi Artifacts appaiono in una finestra dedicata accanto alla conversazione".

"In questo modo si crea uno spazio di lavoro dinamico in cui gli utenti possono vedere, modificare e sviluppare le creazioni di Claude in tempo reale, integrando perfettamente i contenuti generati dall'intelligenza artificiale nei loro progetti e flussi di lavoro".

Claude sta quindi evolvendo da un'intelligenza artificiale conversazionale a un ambiente di lavoro collaborativo, permettendo alle aziende di centralizzare in modo sicuro le loro conoscenze, i documenti e il lavoro in corso in un unico spazio condiviso, con Claude che fungerà da assistente su richiesta.

Anthropic ha parlato anche del futuro: nel corso dell'anno verranno rilasciati Claude 3.5 Haiku e Claude 3.5 Opus, inoltre gli sviluppatori stanno esplorando funzionalità come Memory (che già ChatGPT offre), che consentirà a Claude di ricordare le preferenze e la cronologia delle interazioni di un utente, rendendo l'esperienza più personalizzata ed efficiente.

3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
giovanni6921 Giugno 2024, 11:25 #1
Qualcuno ha testato Claude 3.5 Sonnet per qualche uso speciale?
kalius21 Giugno 2024, 12:53 #2
Io, per coding python e Powershell. Si, è superiore a ChatGPT 4o/ChatGPT 4.

kia6821 Giugno 2024, 22:02 #3
scusate l'ignoranza, uso chat gtp su Iphone ed ora è anche in chat italiana vocale, la app del articolo, fa lo stesso? Potete in tal caso, per cortesia, mettere link applestore grazie.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^