Anthropic lancia l'IA Claude 3 con prestazioni simili (se non superiori) a ChatGPT e Gemini
Anthropic ha annunciato il lancio della sua nuova famiglia di modelli multimodali Claude 3. Haiku, Sonetto e Opus, nello specifico, promettono prestazioni pari o superiori rispetto ai modelli di Google e OpenAI
di Nino Grasso pubblicata il 05 Marzo 2024, alle 11:01 nel canale WebAnthropic
Anthropic, l'azienda di IA guidata da ex dipendenti di OpenAI, ha lanciato una nuova versione del suo modello di IA, Claude 3, promettendo prestazioni in alcuni casi superiori rispetto ai principali concorrenti sul mercato. La nuova famiglia si compone dei modelli Haiku, Sonetto e Opus, d è stata progettata per offrire migliori capacità di elaborazione del linguaggio naturale, ragionamento e comprensione del contesto rispetto a Claude 2.1 e alle iterazioni precedenti.

In breve, secondo Anthropic, Claude 3 riesce a rispondere a più domande, capire istruzioni più lunghe ed è più accurato rispetto alle versioni precedenti. Uno dei miglioramenti più significativi è la capacità multimodale, che permette alla tecnologia di comprendere prompt che includono non solo testo ma anche immagini, una funzionalità che mancava nelle iterazioni meno recenti della tecnologia.
Claude 3 annunciato ufficialmente da Anthropic
Il team di sviluppo ha poi migliorato la tendenza di Claude 2 e 2.1 relativa al rifiuto di rispondere ad alcune richieste "harmless", cioè innocue, un comportamento che, secondo l'azienda, derivava da "una mancanza di comprensione del contesto". Anthropic afferma che i nuovi modelli Claude 3 saranno meno inclini a rifiutare richieste innocue, grazie a una migliore comprensione del contesto e del rispetto dei limiti di sicurezza impostati dall'azienda.
Velocità ed efficienza sono altri due aspetti chiave dei nuovi modelli. Anthropic sostiene che Claude 3 Haiku, il modello più piccolo della famiglia, è "il modello più veloce ed economico sul mercato": è in grado di analizzare documenti di ricerca complessi e completi di tabelle e grafici, in meno di tre secondi. Il modello intermedio Claude 3 Sonetto, invece, è descritto come due volte più veloce di Claude 2 e Claude 2.1, ed eccelle in attività che richiedono risposte rapide.
Le performance rappresentano il punto di forza di tutta la nuova gamma di modelli Claude 3: secondo i benchmark condotti da Anthropic, il modello più grande della famiglia, Claude 3 Opus, ha superato la maggior parte dei modelli concorrenti in diversi test. Ha mostrato una capacità di ragionamento migliore rispetto a GPT-4 di OpenAI, ottenendo il 50,4% di risposte valide rispetto al 35,7% di GPT-4 su attività di ragionamento richieste tipicamente per conseguire una laurea universitaria. Opus ha anche dimostrato prestazioni superiori in matematica, programmazione e comprensione del ragionamento.
Anthropic ha addestrato i modelli Claude 3 su set misti di dati interni, di dati di terze parti non pubblici e dati disponibili pubblicamente datati agosto 2023, utilizzando i servizi Amazon AWS e Google Cloud, due aziende che hanno investito nella società. Claude 3, nello specifico, sarà presto disponibile nella libreria di modelli Bedrock di AWS e in Vertex AI di Google, e configura Anthropic come una realtà molto interessante nel crescente mercato dell'IA generativa, promettendo modelli potenti, veloci e capaci di comprendere il contesto in maniera paragonabile, se non superiore, rispetto ai più blasonati modelli concorrenti. Resta da vedere come questi nuovi modelli si comporteranno nel mondo reale e se riusciranno a soddisfare le aspettative del mercato.











Renault Twingo E-Tech Electric: che prezzo!
Il cuore digitale di F1 a Biggin Hill: l'infrastruttura Lenovo dietro la produzione media
DJI Osmo Mobile 8: lo stabilizzatore per smartphone con tracking multiplo e asta telescopica
Partono altri sconti pesanti su Amazon, alcuni sono -50%: ecco le 27 offerte che attualmente non hanno rivali
OpenAI senza freni: centinaia di miliardi di dollari di ricavi, di cui oltre 20 solo nel 2025
Blink Mini 2 da 34,99€ 15,90€ (-55%) su Amazon: videocamera di sicurezza HD con visione notturna e Alexa
Altro che AGI, la superintelligenza di Microsoft diventa 'umanista': focalizzata, sicura e al servizio delle persone
Il nuovo ECOVACS DEEBOT T30C OMNI GEN2 scende da 599€ a 324€: aspirazione record da 25.000 Pa e lavaggio a 75°C
GeForce RTX 50 SUPER in ritardo o persino cancellate: la memoria GDDR7 è un problema
HYTE X50: il case dalle linee arrotondate che porta una ventata di novità
Sony ULT WEAR in super offerta: le cuffie con il processore delle WH-1000XM5 ora da 110€
Sconti record su smartwatch top: Apple Watch 11, SE 3, Galaxy Watch 8 e Pixel Watch 3 ai minimi storici
NIU continua a crescere: a EICMA 2025 nuovi scooter e nuove moto, e un progetto futuro
DJI Osmo 360 ai prezzi più bassi di sempre su Amazon (-29% reali): si parte da 345€, con autonomia extra nella versione Adventure
Il nuovo Edge 70 conferma la strategia vincente di Motorola tra i marchi più venduti in Europa
Il Re dei mini PC economici: 160€ con 16GB di RAM, SSD 512GB e Ryzen 5, batte qualsiasi concorrente con processori Intel serie N
Smartphone, tablet e auricolari a soli 259 euro: questa offerta di HONOR è irripetibile









12 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoLink ad immagine (click per visualizzarla)
Questo perché gli LLM sono addestrati principalmente per la lingua inglese. Per l'italiano c'è ancora poco o nulla. Tornando all'articolo, è interessante, ma come sempre, meglio aspettare benchmark di terze parti.
Non accetta "clienti" della nostra regione.
ma poi cluade si puo provare solo da pochissima paesi, peccato, sarei curioso
Link ad immagine (click per visualizzarla)
ha totalmente ignorato che il verbo mangiare all'infinito si coniuga "eat" e non "eaten". Ha totalmente ignorato che John è un nome maschile e quindi il pronome "her" è errato e va messo "his". Ha totalmente ignorato che il "why" non è corretto perché si usa per le domande, mentre per le risposte va messo "because". Per non parlare del "sanny" day di cui non si è minimamente accorto!!! Un vero disastro, la mia compagna è insegnante di lingue e ha storto il naso di fronte a tanta superficialità
Dici? io ho passato a copilot degli screenshoot di esercizi di matematica e geometria presi da un libro di seconda media e li ha risolti tranquillamente! ed ha fatto tutto interpretando un' immagine
...e stiamo solo all'inizio.
Noi altri, nel resto del mondo, le utilizziamo con estrema soddisfazione. Io ho aumentato la mia produttività di (e non sto esagerando) almeno 10 volte da quando le uso. Conosco gente che ha addirittura licenziato le segretarie perchè ottengono la stessa qualità a costi immensamente minori.
Però per voi italiani sono inutili.
Link ad immagine (click per visualizzarla)
Solo che ovviamente si usa Copilot gratuito, o quella cosa inutile di Google Bard, o Bing AI e quindi gli LLM sono inutili, non servono a niente. Vero?
Tutti gli LLM hanno problemi con la matematica. E' risaputo. Non parliamo ovviamente di matematica base, si parla di cose ben più complesse. Sono cose che verranno risolte presto.
x Tutti: L'Italiano è la seconda o terza lingua al mondo supportata da ChatGPT. E' probabilmente la migliore dopo l'inglese e ChatGPT la usa a livello universitario. E lo fa da circa un anno, non certo da ieri. Il tedesco fa un pò cagare, ma l'italiano lo parla benissimo.
[IMG] Link ad immagine (click per visualizzarla) [/IMG]
Io non so in che mondo vivete, davvero.
Ps. Torno a studiare giapponese.
LLM addestrati specificatamente per l'italiano c'è poco o nulla ed è quello che darà il vero boost. Un conto è supportare un linguaggio, altro conto è averlo come main core per l'addestramento. Nella lista di chatGPT c'è anche l'armeno, quanto pensi che abbiano usato di addestramento per l'armeno?
Non sono fan della AI, anzi mi spaventa parecchio.. e sono sempre più convinto che tutti quanti non ne hanno la paura che invece dovrebbero avere.
Ma a parte questa premessa, ti rispondo quello che rispondo a tutti quelli che criticano l'attuale utilità o operato delle IA: Teli ricordi i prmissimi personal computer?? Roba tipo il Commodor VIC20?
Non era forse della paccottiglia che serviva a poco o nulla? Ecco.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".