Sommario
Anthropic ha lanciato il suo modello AI più recente, Claude 3.5 Sonnet, che promette di essere il più intelligente, veloce e personale tra i modelli finora sviluppati. Questo nuovo modello è già disponibile per gli utenti di Claude sia sul web che su iOS, ed è anche accessibile agli sviluppatori.
Benchmark e prestazioni
Claude 3.5 Sonnet supera i suoi concorrenti, tra cui GPT-4o di OpenAI e Gemini 1.5 di Google, in una vasta gamma di compiti. Nei test di benchmark, Claude 3.5 Sonnet ha ottenuto punteggi superiori in sette su nove benchmark complessivi e in quattro su cinque benchmark di visione rispetto a GPT-4o, Gemini 1.5 Pro e Llama 3 400B di Meta.
Benchmark | Claude 3.5 Sonnet | GPT-4o | Gemini 1.5 Pro | Llama 3 400B |
---|---|---|---|---|
Overall (7/9) | Superiore | Inferiore | Inferiore | Inferiore |
Vision (4/5) | Superiore | Inferiore | Inferiore | Inferiore |
Funzionalità migliorate
Claude 3.5 Sonnet è progettato per eccellere in varie attività, tra cui:
- Scrittura e traduzione di codice
- Gestione di flussi di lavoro multistep
- Interpretazione di grafici e tabelle
- Trascrizione di testo da immagini
Inoltre, il modello è migliore nella comprensione dell’umorismo e può scrivere in modo più umano.
Nuova funzione: Artifacts
Anthropic ha introdotto una nuova funzione chiamata Artifacts, che permette agli utenti di interagire direttamente con i risultati delle richieste di Claude. Ad esempio, se si chiede al modello di progettare qualcosa, è possibile visualizzare e modificare il progetto direttamente nell’app. Questa funzione consente anche di modificare email e documenti creati da Claude senza doverli copiare in un editor di testo separato.
Visione a lungo termine
Artifacts sembra indicare la visione a lungo termine di Claude come strumento per le aziende per centralizzare in modo sicuro la loro conoscenza, documenti e lavoro in uno spazio condiviso. Questo approccio lo rende più simile a strumenti come Notion o Slack, piuttosto che a semplici chatbot come ChatGPT.
Evoluzione e concorrenza
L’evoluzione di Claude è stata rapida: il modello 3 Opus è stato lanciato a marzo e ora il 3.5 Sonnet già promette miglioramenti significativi. Questo ritmo di sviluppo riflette l’intensa competizione nel settore AI, con OpenAI e Google che rilasciano continuamente versioni migliorate dei loro modelli.
Claude 3.5 Sonnet rappresenta un passo avanti significativo per Anthropic, offrendo prestazioni avanzate e funzionalità migliorate rispetto ai suoi predecessori e concorrenti. Con il continuo sviluppo di nuove funzionalità come Artifacts, Claude sta diventando sempre più uno strumento versatile e potente, non solo per i consumatori ma anche per le aziende.