Google presentó su nuevo asistente de voz Gemini Live, y en este artículo conocerás todo lo que ofrece y sus capacidades. Cómo sacar el máximo provecho a la última propuesta en Inteligencia Artificial que está desarrollando el gigante de Mountain View y mejorar tu rendimiento y productividad.
El chatbot Gemini fue lanzado a principios de 2024 y a la fecha no para de incorporar nuevas funciones. Viene instalado por defecto en los teléfonos Pixel 9 de Google, y su sistema de aprendizaje acumula millones de datos de usuarios de todas partes del mundo. ¿Cómo funciona la respuesta de Google a GPT-4o de OpenAI.
Gemini Live, lo que puede hacer y cómo aprovecharlo
La propuesta de Gemini Live permite hacer diferentes acciones con el asistente de Google, de manera intuitiva y orgánica. Puedes conversar de una forma muy similar a la de un ser humano, y pedir diferentes acciones que hacen a la actividad diaria con tu teléfono móvil.
De momento está disponible únicamente en inglés para los suscriptores a Gemini Advanced. Una propuesta que cuesta 20 euros al mes y que permite acceder presionando el botón de Live en la zona inferior derecha. En las semanas que van trascurriendo, Gemini Live se adapta también a otros idiomas y se podrá utilizar en dispositivos Android y también con iOS.
El vicepresidente de experiencias Gemini de Google, Sissie Hsiao, explicó que Gemini Live puede hacer muchas más cosas que un Google Assistant con IA. Tomando como referencia las críticas y propuestas de la comunidad, se busca que Gemini brinde una comunicación más fluida y natural, sin tener que cambiar la forma de hablar para dar las indicaciones. Otra apuesta fuerte con Google Gemini es que se puedan resolver problemas más complejos, y no únicamente tareas sencillas de la vida cotidiana.
¿Cómo usar Gemini Live?
Al iniciar Gemini Live verás una pantalla en blanco y una luz etérea que brilla en la zona inferior de la pantalla. A partir de ese momento ya puedes hablar con el asistente y mantener una conversación incluso con el móvil bloqueado o con la pantalla apagada. Otra forma de acceder a Gemini Live es mediante los auriculares inalámbricos Pixel Buds Pro 2 de Google, que están especialmente diseñado para el control mediante manos libres. El nuevo asistente de Google ofrece 10 voces distintas con tonos, acentos y estilos muy diferentes al hablar. Una vez que termines la sesión con Gemini, aparecerá una transcripción que luego podrás consultar en cualquier momento desde el historial.
En comparación con los anteriores sistemas de asistente de voz, Gemini Live te deja interrumpir la conservación, sin que esto implique interrumpir el desarrollo total de la experiencia. Puedes conectar el asistente con otras apps mediante el sistema de extensiones, aunque esta es una función que se va actualizando poco a poco.
Entre los ejemplos más extendidos, puedes pedirle a Gemini Live que busque algún texto puntual en tu correo electrónico de Gmail, o pedirle fecha y hora de algún evento al que te hayan invitado. La IA se encarga de revisar las bandejas y darte un detalle pormenorizado de los datos descubiertos.
También puedes pedirle que haya una búsqueda en Internet para hacer un postre, y que luego convierta la receta en una lista de compras en Google Keep. Estas apps de Google como Keep, Notas, Gmail, Calendario y YouTube, son las que primero recibirán compatibilidad con Gemini Live. De esta manera el funcionamiento general del ecosistema Google estará integrado a través del asistente de voz. Con Gemini Live se podrán hacer diferentes acciones que hacen al funcionamiento general del móvil, pero mediante comandos de voz simples y orgánicos.
Project Astra y el futuro de Gemini Live y lo que podrá hacer
Antes de que termine 2024, Google apunta a incorporar Project Astra en Gemini Live. Esta es una tecnología de visión por computadora anunciada durante la conferencia de desarrolladores y permitirá acceso a la cámara del móvil. Podrás preguntarle a Gemini Live en tiempo real sobre elementos enfocados, y obtener respuestas sobre el entorno de forma intuitiva.
Un ejemplo práctico de esta utilidad sería pasar por enfrente del póster de un concierto. Puedes pedirle a Gemini Live que anote la fecha en tu calendario y te recuerde comprar entradas unos días antes.
La propuesta de Gemini Live es mucho más orgánica y versátil que la del asistente de Google. Por es fundamental conocer qué puede hacer, sus alcances y limitaciones. El objetivo de la empresa de Mountain View es desarrollar un sistema capaz de cambiar la manera en que se hacen búsquedas por Internet.
De momento, hay una opción que permite regresar de Gemini Live a Google Assistant, pero no hay datos acerca de cuánto tiempo estará habilitada la opción. El futuro apunta a que será con la IA de Gemini Live y sus diálogos fluidos y orgánicos para descubrir las distintas informaciones y búsquedas.
El futuro de la IA de Google y las posibilidades que se abren
Con la implementación definitiva de Gemini y sus distintas versiones, Google pisa fuerte en el sector de la Inteligencia Artificial. Lejos quedó el tiempo en que Gemini se conocía con el nombre de Bard, y sus últimas actualizaciones e incorporaciones muestran un mundo IA muy activo y con propuestas de crecimiento y expansión.
Gemini Live es la clara demostración de que la IA generativa es el futuro. Los principales desarrolladores de tecnología están abordando diferentes estrategias para incorporarla en sus herramientas. Tal es el caso de OpenAI con Chat-GPT o ahora Google con Gemini Live. Podrás hacer todo tipo de actividades de agenda y gestión directamente desde tu móvil, y con un diálogo fluido y orgánico con más de 10 voces diferentes para personalizar la experiencia.
De momento solamente pueden probar las posibilidades de Gemini Live los usuarios con suscripción, pero nada descarta que se avance con una incorporación gratuita. El asistente de Google empieza a despedirse y dará paso a una experiencia renovada. Basada en IA generativa y en las múltiples posibilidades de un entendimiento y diálogo más orgánico con el propio usuario.