Intelligenza Artificiale
Gemini Live: nuova funzionalità AI su Pixel 9
Tempo di lettura: 4 minuti. Scopri le nuove funzionalità AI del Google Pixel 9 con Gemini, i miglioramenti di accessibilità e la possibilità di operare offline grazie a Gemini Nano.
Google ha introdotto Gemini Live come una delle principali caratteristiche AI del Pixel 9, offrendo un’esperienza conversazionale avanzata che permette interazioni naturali e fluide con l’assistente virtuale. Disponibile inizialmente solo per gli abbonati a Gemini Advanced, questa funzionalità consente agli utenti di dialogare con un esperto su qualsiasi argomento, migliorando l’interazione e l’efficacia del supporto offerto.
Gemini App e le nuove estensioni
Gemini è ora un overlay flottante che consente di mantenere il contesto di ciò che si sta facendo sullo schermo, senza passare a un’interfaccia a schermo intero. Gli utenti possono trascinare e rilasciare immagini generate da Gemini direttamente in Gmail o Google Messaggi, e utilizzare la funzione “Chiedi di questo video” mentre guardano contenuti su YouTube. Le nuove estensioni per Calendar, Tasks, Keep e Utilities saranno disponibili nelle prossime settimane, offrendo una maggiore integrazione con altre app Google.
Interazione e funzionalità Avanzate di Gemini Live
Dalla schermata principale di Gemini, è ora possibile accedere alla nuova funzione Live tramite un pulsante nell’angolo in basso a destra. Gemini Live consente conversazioni vocali, con 10 nuove voci disponibili, ciascuna con caratteristiche uniche. Le conversazioni possono essere interrotte e riprese in qualsiasi momento, con trascrizioni disponibili per consultazioni future.
Gemini Live funziona anche in background, permettendo di continuare le conversazioni mentre si utilizzano altre app o con il telefono bloccato. Google descrive l’esperienza come simile a una chiamata telefonica, rendendo Gemini un “compagno” disponibile in ogni momento per discussioni su nuove idee o per prepararsi a conversazioni importanti.
Disponibilità di Gemini Live
Gemini Live è in fase di rollout globale per gli utenti Android abbonati a Gemini Advanced, inizialmente solo in inglese, con supporto per altre lingue e per iOS in arrivo nelle prossime settimane. Questa funzione rappresenta un passo avanti significativo nelle capacità AI di Google, fornendo un’assistenza più naturale e interattiva agli utenti.
Google Pixel 9: innovazioni AI con Gemini, accessibilità avanzata e funzionalità Offline
Con l’annuncio del Google Pixel 9, emergono importanti novità riguardanti le capacità AI avanzate alimentate da Gemini, nuove funzionalità di accessibilità e la capacità di eseguire molte di queste operazioni senza la necessità di una connessione internet. Questi sviluppi sottolineano il continuo impegno di Google nell’innovazione e nel miglioramento dell’esperienza utente.
Lancio di Google Pixel 9 con Android 14 e funzionalità Gemini
Il Google Pixel 9 è stato lanciato ufficialmente con Android 14, nonostante il lancio di Android 15 sia imminente. Questa scelta ha permesso a Google di includere una serie di funzionalità AI avanzate, come Gemini Live e il nuovo overlay Gemini, che fluttua sopra le app, offrendo un’esperienza utente più intuitiva e dinamica. Queste funzionalità, insieme a Pixel Studio per la generazione di immagini, sono tutte eseguibili su Android 14, mentre altre novità saranno introdotte con Android 15 in un aggiornamento successivo, denominato “Pixel Drop”.
Il Pixel 9 si distingue per il suo display “Super Actua”, prestazioni ottimizzate dal chip Tensor G4 e una fotocamera avanzata che include nuove funzioni AI per migliorare le foto e i video. Nonostante l’attesa per Android 15, il Pixel 9 è già equipaggiato per offrire un’esperienza utente di alto livello con il software attuale.
Aggiornamenti di accessibilità: Magnifier e Guide Frame Migliorati
Parallelamente al lancio del Pixel 9, Google ha introdotto nuovi aggiornamenti di accessibilità, migliorando l’app Magnifier e la funzione Guide Frame per utenti con disabilità visive. L’app Magnifier ora utilizza l’AI per aiutare gli utenti a trovare specifiche parole nell’ambiente circostante, rendendo più semplice la lettura di testi su schermi, menù o altre superfici. Inoltre, l’app offre modalità picture-in-picture e la possibilità di scegliere tra lenti macro e grandangolari.
Guide Frame, già nota per aiutare gli utenti a scattare selfie perfetti, è stata ulteriormente migliorata con un riconoscimento degli oggetti più avanzato e una migliore messa a fuoco dei soggetti, rendendo l’esperienza di utilizzo ancora più fluida e accessibile.
Gemini Nano: funzionalità AI Offline sul Pixel 9
Una delle domande più frequenti riguardanti le nuove funzionalità AI del Pixel 9 è se queste richiedano una connessione internet per funzionare. Grazie al modello AI Gemini Nano, molte delle nuove funzionalità AI possono essere eseguite direttamente sul dispositivo, senza necessità di connettersi a server esterni. Questo non solo migliora la privacy, ma assicura anche tempi di risposta rapidi.
Gemini Nano è integrato nel processore Tensor G4 e gestisce compiti come la comprensione di input testuali, vocali, immagini e audio direttamente sul dispositivo. Tuttavia, per le operazioni più complesse, come la generazione di immagini, potrebbe essere ancora necessaria una connessione internet. Questa capacità di operare offline rappresenta un importante passo avanti, soprattutto per gli utenti che necessitano di funzionalità AI affidabili anche in assenza di connettività.
Un Pixel 9 ricco di innovazioni e funzionalità avanzate
Il Google Pixel 9, con le sue nuove funzionalità AI, aggiornamenti di accessibilità e capacità di eseguire operazioni offline, si posiziona come un dispositivo all’avanguardia nel panorama degli smartphone. Google continua a spingere i confini dell’innovazione, offrendo soluzioni che migliorano l’interazione utente e garantiscono una maggiore inclusività.
Intelligenza Artificiale
L’intelligenza artificiale: strumenti e trattamenti personalizzati in medicina
Tempo di lettura: 2 minuti. L’intelligenza artificiale trasforma la sanità con il Reinforcement Learning e le QuantNets. Strumenti innovativi per trattamenti personalizzati e analisi avanzate.
La ricerca nel campo dell’intelligenza artificiale (AI) continua a progredire, offrendo soluzioni innovative per la gestione delle cure mediche. Gli studi condotti dalla Weill Cornell Medicine e dalla Rockefeller University esplorano l’uso del Reinforcement Learning (RL) per ottimizzare strategie terapeutiche e di nuove reti neurali adattate per dati strutturati come grafi, aprendo la strada a cure personalizzate.
Reinforcement Learning per la gestione di patologie croniche e psichiatriche
Il Reinforcement Learning è una branca dell’AI che consente a modelli di apprendere decisioni ottimali basate su feedback. Utilizzato per eccellere in giochi come scacchi e Go, il RL potrebbe rivoluzionare il trattamento di malattie croniche e psichiatriche, adattandosi in tempo reale alle condizioni dei pazienti e ai risultati delle cure.
Uno studio recente ha introdotto Episodes of Care (EpiCare), il primo benchmark di RL specifico per la sanità. Testando cinque modelli di RL avanzati, i ricercatori hanno dimostrato che, pur superando i metodi standard di cura, questi modelli richiedono enormi quantità di dati simulati per funzionare, rendendo complesso il loro utilizzo nella pratica clinica. Inoltre, strumenti di valutazione basati su dati storici, come gli Off-Policy Evaluation (OPE), si sono dimostrati inaccurati in scenari sanitari reali.
Dr. Logan Grosenick, che ha guidato lo studio, ha sottolineato l’importanza di EpiCare per sviluppare modelli più affidabili e adattabili alla medicina. Migliorare questi strumenti rappresenta un passo cruciale verso trattamenti personalizzati basati sull’AI.
Reti neurali per analisi di dati strutturati a grafo
In un altro studio presentato alla NeurIPS 2024, il team di Dr. Grosenick ha adattato le Convolutional Neural Networks (CNNs) per analizzare dati strutturati a grafo, come reti cerebrali o genetiche. Le CNN, già fondamentali per il riconoscimento delle immagini, sono state generalizzate per modellare graficamente connessioni complesse.
Questa tecnologia, denominata Quantized Graph Convolutional Networks (QuantNets), permette di analizzare i grafi rappresentati da nodi e collegamenti, come quelli tra regioni cerebrali durante il trattamento di depressione o disturbo ossessivo-compulsivo. Il modello è stato applicato a dati EEG con l’obiettivo di identificare dinamiche di connettività cerebrale, consentendo analisi più dettagliate e personalizzate del trattamento.
Le QuantNets hanno potenziale in diversi campi, dalla modellazione del comportamento animale al tracciamento delle espressioni facciali umane per analisi emotive.
Gli studi della Weill Cornell Medicine dimostrano come l’AI stia avvicinando la sanità a un modello più personalizzato. Sia il Reinforcement Learning per strategie terapeutiche che le reti QuantNets per analisi grafiche sono passi significativi verso cure innovative e adattabili. La ricerca continua a sviluppare strumenti affidabili, con l’obiettivo di migliorare la qualità della vita dei pazienti.
Intelligenza Artificiale
L’intelligenza artificiale interpreta lingua dei segni in tempo reale
Tempo di lettura: 2 minuti. L’AI interpreta la lingua dei segni americana con il 98% di accuratezza. Lo studio FAU utilizza MediaPipe e YOLOv8 per un sistema innovativo e accessibile.
Un team di ricercatori della Florida Atlantic University (FAU) ha sviluppato un sistema basato su intelligenza artificiale (AI) in grado di riconoscere con precisione i gesti della lingua dei segni americana (ASL) in tempo reale. Questa innovazione sfrutta tecniche avanzate di computer vision e modelli di deep learning, offrendo una soluzione tecnologica per migliorare la comunicazione tra persone sorde o con difficoltà uditive e il mondo circostante.
L’approccio tecnico: MediaPipe e YOLOv8
Lo studio si concentra sul riconoscimento delle lettere dell’alfabeto ASL utilizzando un dataset personalizzato composto da 29.820 immagini statiche di gesti della mano. Ogni immagine è stata annotata con 21 punti chiave (landmark) usando MediaPipe, un framework di Google dedicato al tracciamento dei movimenti corporei. Questa annotazione dettagliata ha fornito una rappresentazione spaziale accurata della struttura e della posizione della mano.
Questi dati sono stati utilizzati per addestrare YOLOv8, uno dei modelli di deep learning più avanzati per il rilevamento di oggetti, ottimizzando il processo di riconoscimento e classificazione dei gesti.
Bader Alsharif, primo autore della ricerca e candidato al dottorato presso il Dipartimento di Ingegneria Elettrica e Informatica della FAU, ha definito questa integrazione un “approccio innovativo mai esplorato prima, che apre nuove prospettive per applicazioni future.”
Prestazioni del modello e risultati
Il sistema sviluppato ha raggiunto risultati eccezionali, con:
- Accuratezza del 98%,
- Recall del 98%,
- F1 score del 99%,
- Media Average Precision (mAP) del 98%,
- mAP50-95 del 93%.
Questi numeri dimostrano l’efficacia del modello nel catturare anche le più piccole variazioni nei gesti, rendendolo affidabile e robusto in scenari reali.
Secondo Mohammad Ilyas, coautore dello studio e professore alla FAU, il successo è stato reso possibile dalla combinazione di transfer learning, creazione di dataset dettagliati e ottimizzazione dei parametri di apprendimento.
Applicazioni pratiche e prospettive future
Questo sistema ha il potenziale per essere utilizzato in applicazioni pratiche come strumenti di traduzione in tempo reale, migliorando l’accessibilità per la comunità sorda o con difficoltà uditive. Le potenziali aree di applicazione includono:
- Istruzione, per facilitare l’interazione tra studenti sordi e insegnanti.
- Sanità, per garantire una comunicazione più efficace tra pazienti e operatori sanitari.
- Settori sociali, per ridurre le barriere nella vita quotidiana.
Le future ricerche si concentreranno sull’espansione del dataset per includere un numero maggiore di gesti dinamici, migliorando ulteriormente l’accuratezza del modello. Inoltre, gli sforzi si orienteranno verso l’ottimizzazione per dispositivi edge, come smartphone o tablet, garantendo prestazioni in tempo reale anche in ambienti con risorse limitate.
Lo studio condotto dalla Florida Atlantic University rappresenta un importante passo avanti nella creazione di strumenti basati sull’intelligenza artificiale per la traduzione della lingua dei segni americana in tempo reale. Integrando tecnologie avanzate come MediaPipe e YOLOv8, i ricercatori hanno sviluppato un sistema altamente preciso e affidabile, che può migliorare significativamente l’accessibilità e l’inclusività per milioni di persone in tutto il mondo.
Intelligenza Artificiale
OpenAI sotto accusa: Elon Musk e Meta si schierano contro
Tempo di lettura: 3 minuti. Il caso OpenAI-Musk svela le tensioni sulla trasformazione da non-profit a for-profit. Rivelazioni su email e documenti approfondiscono il dibattito etico sull’intelligenza artificiale.
Le recenti rivelazioni di OpenAI gettano nuova luce sulle dinamiche interne che hanno portato alla sua trasformazione in azienda a scopo di lucro, e al ruolo controverso di Elon Musk in questa transizione. Attraverso la pubblicazione di email, documenti e comunicazioni interne, OpenAI ha svelato che Musk, inizialmente uno dei suoi principali sostenitori, aveva proposto cambiamenti strutturali che includessero una componente for-profit già prima della fondazione. Queste informazioni si inseriscono in un quadro legale e morale complesso, che coinvolge anche Microsoft e Meta, e sollevano interrogativi sul futuro dell’intelligenza artificiale e sulla trasparenza delle organizzazioni che la sviluppano.
Le accuse contro Elon Musk
Secondo i documenti rilasciati da OpenAI, Elon Musk avrebbe sostenuto sin dal principio la necessità di includere una struttura for-profit nella fondazione dell’organizzazione. Nel 2017, Musk propose un modello ibrido, con una parte non-profit che guidasse la ricerca e una componente for-profit destinata a capitalizzare i risultati economici. Tuttavia, questa visione includeva anche un elemento controverso: Musk voleva ottenere una quota di maggioranza e diventare il CEO della nuova entità.
Le sue proposte furono respinte dal consiglio di amministrazione di OpenAI, che considerava tale struttura incoerente con la missione originaria dell’organizzazione, focalizzata sull’interesse collettivo e sulla democratizzazione delle tecnologie AI. Musk, di fronte a questa opposizione, rassegnò le dimissioni nel febbraio 2018, sostenendo che il progetto non era più in linea con la sua visione.
Musk e il piano di fusione con Tesla
Uno degli aspetti più sorprendenti emersi dalle comunicazioni interne riguarda la proposta di Elon Musk di fondere OpenAI con Tesla. Musk giustificò questa idea sostenendo che avrebbe garantito la sopravvivenza finanziaria dell’organizzazione e accelerato il suo sviluppo tecnologico, sfruttando le risorse di Tesla per implementare le tecnologie AI nei veicoli autonomi e in altri progetti.
Anche questa proposta fu respinta dal consiglio di amministrazione, che considerava il piano una minaccia per l’indipendenza di OpenAI. Musk, non riuscendo a ottenere il controllo strategico, si allontanò ulteriormente dall’organizzazione e iniziò a progettare la fondazione di una propria azienda di intelligenza artificiale, che sarebbe poi diventata xAI.
La trasformazione di OpenAI in azienda for-profit
Nonostante le dimissioni di Musk, OpenAI ha intrapreso nel 2019 il percorso verso una struttura for-profit, giustificando la decisione con la necessità di attrarre maggiori investimenti per competere con giganti come Google e Amazon. Questo passaggio ha visto l’ingresso di Microsoft come principale partner tecnologico e finanziario, con un accordo che ha garantito all’azienda di Redmond una posizione privilegiata nello sviluppo e nella distribuzione delle tecnologie OpenAI.
Musk ha fortemente criticato questa trasformazione, definendola un tradimento della missione originaria. Tuttavia, i documenti pubblicati da OpenAI sembrano indicare che lo stesso Musk aveva sostenuto in passato un modello simile, minando la credibilità delle sue accuse.
Le implicazioni legali e morali
Le accuse di Elon Musk contro OpenAI e Microsoft si sono tradotte in una battaglia legale che ha avuto molteplici sviluppi. Nel marzo 2023, Musk ha presentato una denuncia per violazione degli accordi contrattuali, sostenendo che l’organizzazione aveva abbandonato i suoi principi fondanti per perseguire profitti. Dopo una serie di ritiri e aggiornamenti delle accuse, Musk ha richiesto nel novembre 2024 un’ingiunzione per bloccare la transizione di OpenAI in azienda for-profit.
OpenAI, dal canto suo, ha respinto queste accuse, pubblicando prove che dimostrano come Musk stesso avesse spinto per un modello a scopo di lucro già nel 2017. L’azienda sostiene che le sue azioni sono in linea con gli obiettivi di sostenibilità e crescita, e che la partnership con Microsoft è stata fondamentale per garantire le risorse necessarie allo sviluppo delle tecnologie AI.
Il contesto etico e l’impatto sull’industria AI
Questo dibattito va oltre le questioni legali e solleva interrogativi più ampi sull’etica delle organizzazioni che sviluppano tecnologie avanzate. La trasformazione di OpenAI in azienda for-profit ha suscitato preoccupazioni nella comunità tecnologica, che teme una concentrazione del potere nelle mani di poche grandi aziende.
In questo contesto, anche Meta ha espresso il suo disappunto, sottolineando i rischi di creare un precedente che potrebbe incentivare altre organizzazioni non-profit a trasformarsi in aziende commerciali dopo aver ricevuto finanziamenti esentasse.
Il caso OpenAI-Musk mette in evidenza la complessità delle decisioni strategiche e le tensioni etiche nell’industria dell’intelligenza artificiale. Mentre OpenAI difende la necessità di attrarre investimenti per sviluppare tecnologie all’avanguardia, le accuse di Musk sollevano dubbi sull’integrità delle motivazioni alla base di queste scelte. Il futuro di OpenAI, e il suo ruolo nell’ecosistema AI globale, rimane un tema di dibattito acceso, con implicazioni che potrebbero ridefinire il rapporto tra innovazione, etica e profitto.
-
Smartphone1 settimana ago
Realme GT 7 Pro vs Motorola Edge 50 Ultra: quale scegliere?
-
Smartphone1 settimana ago
OnePlus 13 vs Google Pixel 9 Pro XL: scegliere o aspettare?
-
Smartphone1 settimana ago
Samsung Galaxy Z Flip 7: il debutto dell’Exynos 2500
-
Smartphone7 giorni ago
Redmi Note 14 Pro+ vs 13 Pro+: quale scegliere?
-
Sicurezza Informatica5 giorni ago
BadBox su IoT, Telegram e Viber: Germania e Russia rischiano
-
Economia1 settimana ago
Controversie e investimenti globali: Apple, Google e TikTok
-
Sicurezza Informatica11 ore ago
Nvidia, SonicWall e Apache Struts: vulnerabilità critiche e soluzioni
-
Sicurezza Informatica6 giorni ago
PUMAKIT: analisi del RootKit malware Linux