Anthropic lancia l'IA Claude 3 con prestazioni simili (se non superiori) a ChatGPT e Gemini

Anthropic lancia l'IA Claude 3 con prestazioni simili (se non superiori) a ChatGPT e Gemini

Anthropic ha annunciato il lancio della sua nuova famiglia di modelli multimodali Claude 3. Haiku, Sonetto e Opus, nello specifico, promettono prestazioni pari o superiori rispetto ai modelli di Google e OpenAI

di pubblicata il , alle 11:01 nel canale Web
Anthropic
 

Anthropic, l'azienda di IA guidata da ex dipendenti di OpenAI, ha lanciato una nuova versione del suo modello di IA, Claude 3, promettendo prestazioni in alcuni casi superiori rispetto ai principali concorrenti sul mercato. La nuova famiglia si compone dei modelli Haiku, Sonetto e Opus, d è stata progettata per offrire migliori capacità di elaborazione del linguaggio naturale, ragionamento e comprensione del contesto rispetto a Claude 2.1 e alle iterazioni precedenti.

In breve, secondo Anthropic, Claude 3 riesce a rispondere a più domande, capire istruzioni più lunghe ed è più accurato rispetto alle versioni precedenti. Uno dei miglioramenti più significativi è la capacità multimodale, che permette alla tecnologia di comprendere prompt che includono non solo testo ma anche immagini, una funzionalità che mancava nelle iterazioni meno recenti della tecnologia.

Claude 3 annunciato ufficialmente da Anthropic

Il team di sviluppo ha poi migliorato la tendenza di Claude 2 e 2.1 relativa al rifiuto di rispondere ad alcune richieste "harmless", cioè innocue, un comportamento che, secondo l'azienda, derivava da "una mancanza di comprensione del contesto". Anthropic afferma che i nuovi modelli Claude 3 saranno meno inclini a rifiutare richieste innocue, grazie a una migliore comprensione del contesto e del rispetto dei limiti di sicurezza impostati dall'azienda.

Velocità ed efficienza sono altri due aspetti chiave dei nuovi modelli. Anthropic sostiene che Claude 3 Haiku, il modello più piccolo della famiglia, è "il modello più veloce ed economico sul mercato": è in grado di analizzare documenti di ricerca complessi e completi di tabelle e grafici, in meno di tre secondi. Il modello intermedio Claude 3 Sonetto, invece, è descritto come due volte più veloce di Claude 2 e Claude 2.1, ed eccelle in attività che richiedono risposte rapide.

Le performance rappresentano il punto di forza di tutta la nuova gamma di modelli Claude 3: secondo i benchmark condotti da Anthropic, il modello più grande della famiglia, Claude 3 Opus, ha superato la maggior parte dei modelli concorrenti in diversi test. Ha mostrato una capacità di ragionamento migliore rispetto a GPT-4 di OpenAI, ottenendo il 50,4% di risposte valide rispetto al 35,7% di GPT-4 su attività di ragionamento richieste tipicamente per conseguire una laurea universitaria. Opus ha anche dimostrato prestazioni superiori in matematica, programmazione e comprensione del ragionamento.

Anthropic ha addestrato i modelli Claude 3 su set misti di dati interni, di dati di terze parti non pubblici e dati disponibili pubblicamente datati agosto 2023, utilizzando i servizi Amazon AWS e Google Cloud, due aziende che hanno investito nella società. Claude 3, nello specifico, sarà presto disponibile nella libreria di modelli Bedrock di AWS e in Vertex AI di Google, e configura Anthropic come una realtà molto interessante nel crescente mercato dell'IA generativa, promettendo modelli potenti, veloci e capaci di comprendere il contesto in maniera paragonabile, se non superiore, rispetto ai più blasonati modelli concorrenti. Resta da vedere come questi nuovi modelli si comporteranno nel mondo reale e se riusciranno a soddisfare le aspettative del mercato.

12 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
silvanotrevi05 Marzo 2024, 11:34 #1
per quanto mi riguarda tutte le IA che ho provato finora sono totalmente inutili. Non sono in grado di risolvermi semplici problemi di matematica. Non sono in grado neanche di correggere semplici errori di grammatica. Sono veramente imbarazzanti:



Link ad immagine (click per visualizzarla)
Unrue05 Marzo 2024, 11:36 #2
Originariamente inviato da: silvanotrevi
Non sono in grado di risolvermi semplici problemi di matematica. Non sono in grado neanche di correggere semplici errori di grammatica. Sono veramente imbarazzanti:


Questo perché gli LLM sono addestrati principalmente per la lingua inglese. Per l'italiano c'è ancora poco o nulla. Tornando all'articolo, è interessante, ma come sempre, meglio aspettare benchmark di terze parti.
les205 Marzo 2024, 11:47 #3
boh, ragazzi, entrambi i commenti mi lasciano perplesso... vanno meglio su inglese, certo, ma funzionano benissimo anche in italiano. inutili? no, mi spiace, non direi proprio. che poi non siano l'ia general purpouse che ci aspettiamo dai film di fantascienza è un altro discorso
gd350turbo05 Marzo 2024, 11:50 #4
nello specifico, questa è inutile per noi...
Non accetta "clienti" della nostra regione.
MikTaeTrioR05 Marzo 2024, 12:21 #5
non so le percentuali mostrate mi sembrano un po' strane, al momento gemini non è che sia proprio al top rispetto a chat gpt invece le mettono quasi al pari...

ma poi cluade si puo provare solo da pochissima paesi, peccato, sarei curioso
silvanotrevi05 Marzo 2024, 12:28 #6
Insomma...anche in inglese la IA è molto superficiale nel trovare errori di grammatica:



Link ad immagine (click per visualizzarla)



ha totalmente ignorato che il verbo mangiare all'infinito si coniuga "eat" e non "eaten". Ha totalmente ignorato che John è un nome maschile e quindi il pronome "her" è errato e va messo "his". Ha totalmente ignorato che il "why" non è corretto perché si usa per le domande, mentre per le risposte va messo "because". Per non parlare del "sanny" day di cui non si è minimamente accorto!!! Un vero disastro, la mia compagna è insegnante di lingue e ha storto il naso di fronte a tanta superficialità
omerook05 Marzo 2024, 12:46 #7
Originariamente inviato da: silvanotrevi
per quanto mi riguarda tutte le IA che ho provato finora sono totalmente inutili. Non sono in grado di risolvermi semplici problemi di matematica. Non sono in grado neanche di correggere semplici errori di grammatica. Sono veramente imbarazzanti:


Dici? io ho passato a copilot degli screenshoot di esercizi di matematica e geometria presi da un libro di seconda media e li ha risolti tranquillamente! ed ha fatto tutto interpretando un' immagine

...e stiamo solo all'inizio.
kalius05 Marzo 2024, 12:55 #8
Solo nei forum italiani leggo che le intelligenze artificiali generative sono "inutili" o "non servono a niente".

Noi altri, nel resto del mondo, le utilizziamo con estrema soddisfazione. Io ho aumentato la mia produttività di (e non sto esagerando) almeno 10 volte da quando le uso. Conosco gente che ha addirittura licenziato le segretarie perchè ottengono la stessa qualità a costi immensamente minori.

Però per voi italiani sono inutili.


Originariamente inviato da: silvanotrevi
per quanto mi riguarda tutte le IA che ho provato finora sono totalmente inutili. Non sono in grado di risolvermi semplici problemi di matematica. Non sono in grado neanche di correggere semplici errori di grammatica. Sono veramente imbarazzanti


Link ad immagine (click per visualizzarla)


Solo che ovviamente si usa Copilot gratuito, o quella cosa inutile di Google Bard, o Bing AI e quindi gli LLM sono inutili, non servono a niente. Vero?

Tutti gli LLM hanno problemi con la matematica. E' risaputo. Non parliamo ovviamente di matematica base, si parla di cose ben più complesse. Sono cose che verranno risolte presto.


x Tutti: L'Italiano è la seconda o terza lingua al mondo supportata da ChatGPT. E' probabilmente la migliore dopo l'inglese e ChatGPT la usa a livello universitario. E lo fa da circa un anno, non certo da ieri. Il tedesco fa un pò cagare, ma l'italiano lo parla benissimo.

[IMG] Link ad immagine (click per visualizzarla) [/IMG]

Io non so in che mondo vivete, davvero.

Ps. Torno a studiare giapponese.
Unrue05 Marzo 2024, 13:10 #9
Originariamente inviato da: les2
boh, ragazzi, entrambi i commenti mi lasciano perplesso... vanno meglio su inglese, certo, ma funzionano benissimo anche in italiano. inutili? no, mi spiace, non direi proprio. che poi non siano l'ia general purpouse che ci aspettiamo dai film di fantascienza è un altro discorso


LLM addestrati specificatamente per l'italiano c'è poco o nulla ed è quello che darà il vero boost. Un conto è supportare un linguaggio, altro conto è averlo come main core per l'addestramento. Nella lista di chatGPT c'è anche l'armeno, quanto pensi che abbiano usato di addestramento per l'armeno? Tanto è vero che stanno partendo adesso grossi progetti proprio in tale ambito, ovvero LLM focalizzati sulla lingua italiana.
demon7705 Marzo 2024, 14:26 #10
Originariamente inviato da: silvanotrevi
per quanto mi riguarda tutte le IA che ho provato finora sono totalmente inutili. Non sono in grado di risolvermi semplici problemi di matematica. Non sono in grado neanche di correggere semplici errori di grammatica. Sono veramente imbarazzanti:


Non sono fan della AI, anzi mi spaventa parecchio.. e sono sempre più convinto che tutti quanti non ne hanno la paura che invece dovrebbero avere.

Ma a parte questa premessa, ti rispondo quello che rispondo a tutti quelli che criticano l'attuale utilità o operato delle IA: Teli ricordi i prmissimi personal computer?? Roba tipo il Commodor VIC20?
Non era forse della paccottiglia che serviva a poco o nulla? Ecco.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^