Sommario
Questa settimana, Google ha annunciato importanti novità per gli sviluppatori riguardanti Gemini, incluso un aggiornamento significativo per Gemini 1.5 Pro. Durante l’I/O 2024, Google ha rivelato che Gemini 1.5 Pro ora offre una finestra di contesto da 2 milioni di token, consentendo di processare enormi quantità di dati in vari formati.
Specifiche e capacità di Gemini 1.5 Pro
Caratteristica | Dettagli |
---|---|
Finestra di Contesto | 2 milioni di token |
Capacità di Elaborazione | 2 ore di video, 22 ore di audio, oltre 60.000 righe di codice, e oltre 1,4 milioni di parole |
Utilizzo Attuale | Usato da rivenditori di fast food, istituzioni finanziarie, assicuratori e una società sportiva |
Gemini 1.5 Pro è già in uso in vari settori per attività come l’analisi di video sportivi, la ricerca di bug in grandi basi di codice, e l’analisi di librerie di ricerca. La finestra di contesto ampliata permette alle organizzazioni di esplorare nuovi orizzonti grazie alla capacità di elaborare enormi quantità di dati simultaneamente.
Disponibilità di Gemini 1.5 Flash
Caratteristica | Dettagli |
---|---|
Finestra di Contesto | 1 milione di token |
Latenza | Bassa latenza |
Prezzi | Competitivi |
Casi d’Uso Ideali | Agenti di chat per il retail, elaborazione di documenti, agenti di ricerca che possono sintetizzare interi archivi |
Google ha esplicitamente confrontato Gemini 1.5 Flash con GPT-3.5 Turbo, sottolineando i seguenti vantaggi:
Confronto | Gemini 1.5 Flash |
---|---|
Finestra di Contesto | 1 milione di token, circa 60 volte più grande di GPT-3.5 Turbo |
Velocità | In media, il 40% più veloce di GPT-3.5 Turbo con input di 10.000 caratteri |
Costo di Input | Fino a 4 volte inferiore rispetto a GPT-3.5 Turbo, con caching del contesto abilitato per input superiori a 32.000 caratteri |
Altre novità di Google
- Gemma 2: Disponibile globalmente in dimensioni da 9 miliardi e 27 miliardi di parametri.
- Imagen 3: Lancio in anteprima per i clienti Vertex AI con accesso anticipato, offrendo generazione più rapida del 40%, migliore comprensione dei prompt e rendering più realistico delle immagini.