Project Genie, el prototipo de IA de Google para crear mundos interactivos

  • Project Genie combina Genie 3, Nano Banana Pro y Gemini para generar mundos virtuales interactivos a partir de texto o imágenes.
  • El acceso está limitado a suscriptores de Google AI Ultra en Estados Unidos, con sesiones de hasta 60 segundos y resolución en torno a 720p.
  • La herramienta permite bocetar, explorar y mezclar mundos en tiempo real, pero arrastra fallos de realismo, latencia y control de personajes.
  • Su capacidad para imitar juegos conocidos abre debates sobre derechos de autor y preocupa a parte de la industria del videojuego.

Proyecto de IA para generar mundos interactivos

Google ha dado un nuevo paso en su ofensiva de inteligencia artificial aplicada a los videojuegos y los mundos virtuales con el lanzamiento de Project Genie, un prototipo que permite generar y recorrer escenarios interactivos a partir de unas pocas indicaciones de texto o de una imagen. La compañía presenta la herramienta como un experimento todavía en pruebas, pero sus primeras demostraciones han despertado tanto expectativas como dudas dentro del sector.

Por ahora, el acceso se limita a los suscriptores del plan Google AI Ultra en Estados Unidos, con sesiones breves y un rendimiento claramente marcado por el carácter experimental del sistema. Aun así, el proyecto apunta a un futuro en el que cualquier usuario podría crear un pequeño “mundo jugable” en cuestión de segundos, sin necesidad de saber programar ni manejar motores gráficos.

Qué es Project Genie y qué tecnologías combina

Generador de mundos con inteligencia artificial

Project Genie es un prototipo de investigación desarrollado por Google DeepMind y Google AI que funciona como un generador de mundos interactivos. Su base técnica se apoya en tres pilares: el modelo Genie 3, especializado en simular entornos dinámicos; Nano Banana Pro, encargado de la parte visual y de los bocetos; y Gemini, el modelo multimodal que interpreta las instrucciones del usuario y actúa como asistente durante la creación.

El corazón del sistema es Genie 3, un modelo de “mundo” capaz de predecir fotograma a fotograma lo que ocurre en pantalla. A diferencia de tecnologías previas que solo generaban escenas estáticas en 3D, este enfoque permite que el entorno reaccione a los movimientos del jugador en tiempo real, con resolución aproximada de 720p y varios minutos de coherencia visual según los experimentos internos de DeepMind.

Sobre esa base se integra Nano Banana Pro, responsable de generar la imagen inicial del escenario a partir de un texto descriptivo o una imagen de referencia. Esa primera vista sirve como boceto para decidir el estilo gráfico, la composición del mundo y el aspecto del personaje que se controlará durante la exploración.

Por último, Gemini actúa como capa de orquestación y asistente: interpreta las instrucciones en lenguaje natural, ayuda a ajustar el mundo sobre la marcha y facilita tareas como cambiar la perspectiva (primera o tercera persona), remezclar un entorno ya creado o combinar varias ideas en un solo escenario jugable.

Cómo se generan y se exploran los mundos virtuales

Mundos interactivos generados por IA

El funcionamiento de Project Genie se articula en un proceso progresivo en tres fases que Google resume como bocetado, exploración y mezcla de mundos. El objetivo es que cualquier persona pueda pasar de una idea a una pequeña experiencia interactiva sin herramientas adicionales.

En la primera etapa, el usuario escribe una descripción del mundo que quiere crear o sube una imagen de referencia. A partir de esa entrada, Nano Banana Pro genera una previsualización estática del escenario: un bosque de estilo low-poly, un entorno urbano futurista, un paisaje histórico o lo que se haya descrito en el texto. También se define en esta fase el tipo de personaje, el modo de cámara y algunos parámetros básicos de movimiento.

Una vez aceptado el boceto, entra en juego Genie 3 para permitir que el jugador recorra el entorno con libertad, usando controles típicos de PC como las teclas W, A, S y D. El modelo genera sobre la marcha lo que va apareciendo delante del personaje, prediciendo cada fotograma en función de los anteriores y manteniendo una cierta coherencia cuando se gira la cámara o se regresa a una zona ya visitada.

La tercera capacidad clave es la combinación y remezcla de mundos. El sistema permite retomar escenarios generados anteriormente, modificarlos con nuevos parámetros, fusionarlos entre sí o incluso partir de mundos pregenerados por Google como base para construir variaciones. Además, se pueden compartir vídeos de las sesiones para que otros usuarios los vean o los utilicen como inspiración.

Todo ello se ejecuta desde una aplicación web similar a otros servicios de Google AI, de forma que no es necesario instalar programas adicionales ni disponer de conocimientos técnicos avanzados. Basta con acceder a la herramienta, introducir la instrucción y empezar a probar combinaciones hasta dar con un resultado interesante.

Limitaciones técnicas: tiempo, rendimiento y realismo

Limitaciones de un prototipo de IA para mundos virtuales

Google insiste en definir Project Genie como un prototipo de investigación con un marcado carácter experimental. Esa etiqueta no es un simple formalismo: la experiencia actual presenta varios límites claros que condicionan el uso práctico de la herramienta más allá de la curiosidad inicial.

El más evidente es el tope de 60 segundos por sesión de generación y exploración. Tras ese minuto, el mundo se cierra y es necesario iniciar una nueva experiencia. Desde la compañía explican que esta restricción permite repartir mejor los recursos computacionales, ya que cada sesión reserva un chip dedicado para el usuario que está jugando.

En términos de rendimiento, las pruebas públicas describen una resolución cercana a 720p y una frecuencia de entre 20 y 24 fotogramas por segundo, acompañadas de un input lag apreciable al mover al personaje o cambiar la cámara. La sensación, según algunos de los primeros testers, es la de un vídeo interactivo más que la de un videojuego tradicional plenamente fluido.

También hay que tener en cuenta que Genie 3 no es un motor gráfico clásico, sino un modelo que predice el siguiente fotograma a partir de los anteriores. Eso se traduce en comportamientos extraños: caminos que cambian de textura sin motivo aparente, elementos que desaparecen, físicas poco verosímiles o animaciones que se deforman de forma aleatoria.

La propia Google advierte de que los mundos generados “pueden no parecer totalmente reales ni ajustarse siempre a las indicaciones o a las leyes de la física”, y que el control de los personajes puede resultar impreciso. Es decir, la tecnología apunta maneras, pero aún dista de ofrecer una experiencia de juego pulida en términos de jugabilidad y estabilidad visual.

Acceso restringido y hoja de ruta internacional

Acceso limitado a un prototipo de IA

En esta primera fase, Project Genie solo está disponible para clientes de Google AI Ultra en Estados Unidos, el plan de suscripción más avanzado de la compañía orientado a empresas y creadores que necesitan capacidades de IA de alto rendimiento. Se trata de un servicio de pago elevado, lo que limita el número de usuarios con acceso al experimento.

La decisión de restringir la prueba se explica tanto por el coste computacional de cada sesión como por el interés de Google en recopilar feedback detallado antes de un despliegue más amplio. El director de Investigación de DeepMind, Shlomi Frutcher, ha subrayado que es “emocionante” poder abrir estas herramientas a más gente para recabar opiniones reales de uso, pero por ahora no hay una fecha concreta para su llegada a Europa o a otros mercados.

Desde la óptica de usuarios y estudios españoles y europeos, esto se traduce en que, al menos a corto plazo, el papel más realista será el de observador: seguir de cerca las pruebas, analizar los vídeos que ya circulan en redes sociales y valorar en qué medida esta tecnología podría integrarse en flujos de trabajo de diseño de niveles, prototipado rápido o visualización de ideas.

Google ha señalado su intención de ampliar el acceso progresivamente siempre que el rendimiento, los costes y las cuestiones legales lo permitan. No obstante, el ritmo de esa expansión dependerá también de la respuesta de la comunidad y de cómo evolucionen los debates sobre derechos de autor y uso responsable de contenidos de terceros.

Capacidad para imitar juegos conocidos y debate sobre copyright

Uno de los puntos más delicados de Project Genie ha sido su capacidad para recrear, con mayor o menor fortuna, mundos claramente inspirados en videojuegos ya existentes. Algunos periodistas especializados han logrado generar escenarios que recordaban de forma evidente a títulos como Super Mario 64, Metroid Prime o The Legend of Zelda: Breath of the Wild.

En el caso de Zelda, se han llegado a ver personajes que despliegan una paravela al saltar, un gesto muy asociado al juego de Nintendo. Estas coincidencias sugieren que el modelo ha sido entrenado con una gran cantidad de vídeos de jugabilidad disponibles públicamente en la web, lo que plantea preguntas sobre el tratamiento de las propiedades intelectuales en el entrenamiento de sistemas de IA.

Tras varias pruebas en las que se recreaban mundos inspirados en franquicias muy reconocibles, Google ha empezado a bloquear la generación de ciertos escenarios y personajes, especialmente cuando se mencionan nombres concretos o marcas registradas. En algunos casos, la herramienta impide directamente crear mundos basados en determinadas sagas alegando “intereses de proveedores de contenido de terceros”.

La compañía explica que Project Genie está “entrenado principalmente con datos disponibles públicamente en la web”, pero recuerda que esos contenidos siguen sujetos a las leyes de copyright. El resultado es un sistema de moderación todavía en construcción, en el que algunos intentos de reproducir obras protegidas se frenan de forma explícita y otros se cuelan siempre que se eviten referencias demasiado directas.

Este comportamiento irregular alimenta el debate sobre hasta qué punto la IA puede o debe inspirarse en juegos existentes y dónde se sitúa la línea entre homenaje, imitación y copia. Un debate que, previsiblemente, será especialmente relevante en regiones como la Unión Europea, donde los marcos regulatorios sobre datos de entrenamiento y derechos de autor en IA están en plena definición.

Impacto potencial en la industria del videojuego

Más allá del atractivo mediático de ver mundos “a lo Mario” o “a lo Zelda” generados en segundos, Project Genie se inscribe en una carrera más amplia entre grandes tecnológicas por aplicar la IA generativa al desarrollo de juegos. Microsoft, por ejemplo, ha presentado proyectos como Muse para automatizar parte del diseño y la producción, y otras compañías exploran soluciones similares para abaratar costes y acelerar procesos.

En este contexto, la propuesta de Google apunta a convertirse en una herramienta de prototipado rápido y experimentación que podría interesar tanto a estudios independientes como a grandes editoras. La posibilidad de levantar un escenario jugable a partir de un boceto o de un párrafo de texto puede facilitar la validación temprana de ideas, la creación de demos internas o la prueba de mecánicas sin invertir meses de trabajo.

Sin embargo, el despegue de este tipo de soluciones suscita inquietud entre parte del sector. Por un lado, hay preocupación por el posible impacto en ciertos perfiles profesionales si parte del contenido se genera automáticamente. Por otro, muchos desarrolladores recelan de modelos de negocio en los que la IA se entrena con obras ya publicadas sin una compensación clara para sus autores.

En los mercados europeo y español, donde el debate sobre la protección de la creación cultural es especialmente intenso, será clave ver cómo encajan herramientas como Project Genie en las futuras normativas. Aspectos como la transparencia sobre los datos de entrenamiento, los sistemas de opt-out para titulares de derechos o la atribución de contenidos generados pueden marcar la diferencia entre una adopción prudente y un conflicto continuado con desarrolladores y editoriales.

De momento, Project Genie permanece en un estadio temprano en el que funciona más como laboratorio público que como producto acabado. Su evolución, y la forma en que Google gestione las cuestiones legales y éticas asociadas, determinarán si acaba integrándose en los flujos de trabajo de los estudios o se queda como un experimento llamativo pero limitado.

Con todo, la aparición de este prototipo deja claro que las grandes tecnológicas ven en la generación automática de mundos interactivos un terreno estratégico de primer orden. Aunque hoy su uso real sea restringido y plagado de imperfecciones técnicas, la dirección de viaje está marcada: modelos cada vez más capaces de transformar texto e imágenes en experiencias jugables, y una industria que tendrá que decidir cómo quiere convivir con esas nuevas herramientas.

Artículo relacionado:
Definición de realidad virtual ¡Lo que debes conocer!