Anthropic lancia l'IA Claude 3 con prestazioni simili (se non superiori) a ChatGPT e Gemini

Anthropic ha annunciato il lancio della sua nuova famiglia di modelli multimodali Claude 3. Haiku, Sonetto e Opus, nello specifico, promettono prestazioni pari o superiori rispetto ai modelli di Google e OpenAI
di Nino Grasso pubblicata il 05 Marzo 2024, alle 11:01 nel canale WebAnthropic
Anthropic, l'azienda di IA guidata da ex dipendenti di OpenAI, ha lanciato una nuova versione del suo modello di IA, Claude 3, promettendo prestazioni in alcuni casi superiori rispetto ai principali concorrenti sul mercato. La nuova famiglia si compone dei modelli Haiku, Sonetto e Opus, d è stata progettata per offrire migliori capacità di elaborazione del linguaggio naturale, ragionamento e comprensione del contesto rispetto a Claude 2.1 e alle iterazioni precedenti.
In breve, secondo Anthropic, Claude 3 riesce a rispondere a più domande, capire istruzioni più lunghe ed è più accurato rispetto alle versioni precedenti. Uno dei miglioramenti più significativi è la capacità multimodale, che permette alla tecnologia di comprendere prompt che includono non solo testo ma anche immagini, una funzionalità che mancava nelle iterazioni meno recenti della tecnologia.
Claude 3 annunciato ufficialmente da Anthropic
Il team di sviluppo ha poi migliorato la tendenza di Claude 2 e 2.1 relativa al rifiuto di rispondere ad alcune richieste "harmless", cioè innocue, un comportamento che, secondo l'azienda, derivava da "una mancanza di comprensione del contesto". Anthropic afferma che i nuovi modelli Claude 3 saranno meno inclini a rifiutare richieste innocue, grazie a una migliore comprensione del contesto e del rispetto dei limiti di sicurezza impostati dall'azienda.
Velocità ed efficienza sono altri due aspetti chiave dei nuovi modelli. Anthropic sostiene che Claude 3 Haiku, il modello più piccolo della famiglia, è "il modello più veloce ed economico sul mercato": è in grado di analizzare documenti di ricerca complessi e completi di tabelle e grafici, in meno di tre secondi. Il modello intermedio Claude 3 Sonetto, invece, è descritto come due volte più veloce di Claude 2 e Claude 2.1, ed eccelle in attività che richiedono risposte rapide.
Le performance rappresentano il punto di forza di tutta la nuova gamma di modelli Claude 3: secondo i benchmark condotti da Anthropic, il modello più grande della famiglia, Claude 3 Opus, ha superato la maggior parte dei modelli concorrenti in diversi test. Ha mostrato una capacità di ragionamento migliore rispetto a GPT-4 di OpenAI, ottenendo il 50,4% di risposte valide rispetto al 35,7% di GPT-4 su attività di ragionamento richieste tipicamente per conseguire una laurea universitaria. Opus ha anche dimostrato prestazioni superiori in matematica, programmazione e comprensione del ragionamento.
Anthropic ha addestrato i modelli Claude 3 su set misti di dati interni, di dati di terze parti non pubblici e dati disponibili pubblicamente datati agosto 2023, utilizzando i servizi Amazon AWS e Google Cloud, due aziende che hanno investito nella società. Claude 3, nello specifico, sarà presto disponibile nella libreria di modelli Bedrock di AWS e in Vertex AI di Google, e configura Anthropic come una realtà molto interessante nel crescente mercato dell'IA generativa, promettendo modelli potenti, veloci e capaci di comprendere il contesto in maniera paragonabile, se non superiore, rispetto ai più blasonati modelli concorrenti. Resta da vedere come questi nuovi modelli si comporteranno nel mondo reale e se riusciranno a soddisfare le aspettative del mercato.
12 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoLink ad immagine (click per visualizzarla)
Questo perché gli LLM sono addestrati principalmente per la lingua inglese. Per l'italiano c'è ancora poco o nulla. Tornando all'articolo, è interessante, ma come sempre, meglio aspettare benchmark di terze parti.
Non accetta "clienti" della nostra regione.
ma poi cluade si puo provare solo da pochissima paesi, peccato, sarei curioso
Link ad immagine (click per visualizzarla)
ha totalmente ignorato che il verbo mangiare all'infinito si coniuga "eat" e non "eaten". Ha totalmente ignorato che John è un nome maschile e quindi il pronome "her" è errato e va messo "his". Ha totalmente ignorato che il "why" non è corretto perché si usa per le domande, mentre per le risposte va messo "because". Per non parlare del "sanny" day di cui non si è minimamente accorto!!! Un vero disastro, la mia compagna è insegnante di lingue e ha storto il naso di fronte a tanta superficialità
Dici? io ho passato a copilot degli screenshoot di esercizi di matematica e geometria presi da un libro di seconda media e li ha risolti tranquillamente! ed ha fatto tutto interpretando un' immagine
...e stiamo solo all'inizio.
Noi altri, nel resto del mondo, le utilizziamo con estrema soddisfazione. Io ho aumentato la mia produttività di (e non sto esagerando) almeno 10 volte da quando le uso. Conosco gente che ha addirittura licenziato le segretarie perchè ottengono la stessa qualità a costi immensamente minori.
Però per voi italiani sono inutili.
Link ad immagine (click per visualizzarla)
Solo che ovviamente si usa Copilot gratuito, o quella cosa inutile di Google Bard, o Bing AI e quindi gli LLM sono inutili, non servono a niente. Vero?
Tutti gli LLM hanno problemi con la matematica. E' risaputo. Non parliamo ovviamente di matematica base, si parla di cose ben più complesse. Sono cose che verranno risolte presto.
x Tutti: L'Italiano è la seconda o terza lingua al mondo supportata da ChatGPT. E' probabilmente la migliore dopo l'inglese e ChatGPT la usa a livello universitario. E lo fa da circa un anno, non certo da ieri. Il tedesco fa un pò cagare, ma l'italiano lo parla benissimo.
[IMG] Link ad immagine (click per visualizzarla) [/IMG]
Io non so in che mondo vivete, davvero.
Ps. Torno a studiare giapponese.
LLM addestrati specificatamente per l'italiano c'è poco o nulla ed è quello che darà il vero boost. Un conto è supportare un linguaggio, altro conto è averlo come main core per l'addestramento. Nella lista di chatGPT c'è anche l'armeno, quanto pensi che abbiano usato di addestramento per l'armeno?
Non sono fan della AI, anzi mi spaventa parecchio.. e sono sempre più convinto che tutti quanti non ne hanno la paura che invece dovrebbero avere.
Ma a parte questa premessa, ti rispondo quello che rispondo a tutti quelli che criticano l'attuale utilità o operato delle IA: Teli ricordi i prmissimi personal computer?? Roba tipo il Commodor VIC20?
Non era forse della paccottiglia che serviva a poco o nulla? Ecco.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".