Google ha iniziato a rilasciare nuove funzionalità basate sull’intelligenza artificiale per il suo chatbot, Gemini. Secondo quanto riferito da un portavoce dell’azienda a The Verge, presto Gemini sarà in grado di “vedere” il mondo attraverso lo schermo e la fotocamera dello smartphone, una capacità simile alla modalità avanzata di ChatGPT introdotta da OpenAI alla fine del 2024. L’aggiornamento arriva quasi un anno dopo la dimostrazione delle potenzialità di Project Astra, un progetto di ricerca di Google volto a sviluppare un assistente IA universale avanzato. L’esistenza di queste nuove funzioni, che saranno integrate in Gemini Live – la modalità progettata per conversazioni più naturali e fluide – è stata rivelata grazie a una segnalazione su Reddit. Un utente, che avrebbe avuto accesso in anteprima alla funzione su uno smartphone Xiaomi, ha condiviso le prime impressioni.

Le novità principali si concentrano su due aree chiave:

Lettura dello schermo : Gemini sarà in grado di analizzare e rispondere a domande basate su ciò che viene visualizzato sul display, offrendo un’assistenza più contestuale e immediata;

: Gemini sarà in grado di analizzare e rispondere a domande basate su ciò che viene visualizzato sul display, offrendo un’assistenza più contestuale e immediata; Interpretazione dei flussi video in tempo reale: l’IA potrà “leggere” le immagini catturate dalla fotocamera dello smartphone e fornire risposte o suggerimenti pertinenti.

Un esempio pratico di questa innovazione è l’uso di Gemini per consigliare il colore di vernice più adatto a un oggetto in ceramica, basandosi sull’analisi visiva.

Stando alle prime informazioni, Google sta distribuendo queste funzionalità agli abbonati Gemini Advanced, come parte del piano Google One AI Premium.

