OpenAI ha dado un paso más en la integración de la inteligencia artificial con el uso diario del ordenador al renovar en profundidad Codex, su agente de código para escritorio. La herramienta, que hasta ahora se conocía sobre todo por ayudar a programar, pasa a convertirse en un asistente capaz de manejar aplicaciones, recordar preferencias y gestionar proyectos de manera casi continua.
Con esta actualización, la compañía liderada por Sam Altman acerca su plan de crear una “superaplicación” de escritorio que unifique ChatGPT, Codex y su navegador Atlas. El movimiento busca simplificar la experiencia del usuario, concentrar recursos en un solo espacio de trabajo y plantar cara a rivales como Anthropic, especialmente en el entorno de desarrollo de software y la automatización avanzada.
Codex aprende a usar el ordenador como un usuario más
Uno de los cambios más llamativos es que Codex puede ahora controlar el ordenador en segundo plano. El agente es capaz de ver lo que hay en pantalla, mover su propio cursor, hacer clic, escribir texto y reaccionar a lo que ocurre en las aplicaciones instaladas, sin interrumpir lo que el usuario esté haciendo con el ratón o el teclado.
Esta capacidad permite que varios agentes de Codex trabajen en paralelo en el mismo equipo, realizando pruebas, cambiando configuraciones o ejecutando tareas repetitivas mientras la persona sigue con su actividad normal. De este modo, se abre la puerta a automatizar flujos de trabajo que antes requerían supervisión constante, como probar una aplicación tras cada cambio de código o repetir acciones de interfaz.
OpenAI plantea esta función como una forma de que el asistente pueda operar con herramientas que no tienen API o integraciones directas, algo habitual en muchos programas de escritorio. Codex, al “ver” la pantalla y controlar el cursor, puede interactuar con esas aplicaciones igual que lo haría un usuario humano, aunque por ahora de forma controlada y con especial atención a la seguridad.
Según la compañía, el uso del ordenador está disponible inicialmente en macOS a través de la aplicación de escritorio de Codex, vinculada a una cuenta de ChatGPT. La versión para Windows llegará más adelante, una vez se compruebe el rendimiento y se adapten las funciones al entorno de Microsoft.
En el caso de Europa y Reino Unido, OpenAI ha confirmado que el control del ordenador, la personalización avanzada, las sugerencias contextuales y la memoria se activarán más tarde. El motivo es la necesidad de ajustar estas características a la normativa de protección de datos, un requisito especialmente exigente en la Unión Europea y el mercado británico.

Navegador integrado y trabajo directo sobre páginas web
La actualización también refuerza la relación de Codex con la web gracias a un navegador integrado dentro de la propia aplicación. En lugar de limitarse a recibir instrucciones de texto genéricas, el agente puede recibir órdenes directamente sobre elementos concretos de una página.
En el desarrollo frontend, por ejemplo, el usuario puede seleccionar un componente de la web y describir el cambio que quiere hacer (como modificar el color, el tamaño del texto o la disposición de un bloque), y Codex entiende la instrucción en ese contexto visual concreto. Eso evita tener que redactar prompts largos explicando qué parte del sitio hay que alterar.
Este navegador embebido permite además que Codex analice contenido, recopile información y la utilice como contexto para otras tareas, como documentar código, revisar especificaciones de un producto o comparar documentación técnica. Todo se realiza dentro del mismo entorno, sin tener que saltar entre múltiples ventanas del sistema operativo.
Generación y edición de imágenes con gpt-image-1.5
Otro pilar de la nueva versión de Codex es la integración del modelo gpt-image-1.5 para crear y modificar imágenes desde la propia aplicación de escritorio. El agente puede generar gráficos, diagramas, maquetas o bocetos visuales a partir de texto, o combinando instrucciones con capturas de pantalla y fragmentos de código.
Esta capacidad apunta directamente a los equipos que trabajan en diseño de productos, interfaces de usuario o prototipos de videojuegos. Por ejemplo, un desarrollador puede capturar la pantalla de una interfaz a medio hacer, pedir a Codex que proponga un rediseño del menú o un nuevo esquema de colores y obtener imágenes generadas que se ajusten a ese contexto, sin cambiar de herramienta.
Al estar todo centralizado en Codex, los agentes pueden encadenar tareas de código y diseño: escribir la lógica de una funcionalidad, actualizar el frontend correspondiente y generar una maqueta visual para presentarla al equipo, sin salir del flujo de trabajo ni tener que abrir aplicaciones externas de edición gráfica.
Memoria, contexto y automatización de tareas a largo plazo
Más allá del control del ordenador y la generación de imágenes, la gran apuesta de OpenAI con esta versión es dotar a Codex de una memoria persistente y una gestión de contexto mucho más amplia. La herramienta puede reutilizar conversaciones previas, conservar información importante y recuperarla cuando haga falta para continuar un proyecto.
La función de memoria, que se lanza en vista previa, permite que Codex recuerde preferencias personales, correcciones frecuentes o datos que costó recopilar. Esto incluye desde el stack tecnológico habitual de un equipo hasta la forma de organizar carpetas, los formatos de informe más usados o la etiqueta que suele utilizarse en GitHub para cierto tipo de incidencias.
Con ese contexto acumulado, el agente puede proponer tareas de forma proactiva: sugerir retomar un proyecto que quedó a medias, recomendar una refactorización pendiente o avisar de pull requests abiertos desde hace tiempo. En algunas empresas ya se está empleando para seguir conversaciones en Slack, Gmail o Notion y reaccionar cuando se desencadenan ciertos eventos.
Codex también puede programar trabajo para el futuro y reactivarse de manera autónoma para completar tareas de largo recorrido. Por ejemplo, puede gestionar durante días o semanas una cola de revisiones de código, ir resolviendo comentarios y actualizando documentación sin que el desarrollador tenga que estar pendiente todo el tiempo.
Más de 90 complementos y soporte mejorado para desarrolladores
Para completar el cambio, OpenAI ha añadido cerca de 90 nuevos complementos (plugins) a Codex, entre los que se incluyen integraciones con Microsoft Suite, GitLab Issues, Neon by Databricks, Render o Superpowers, además del soporte para servidores MCP (Model Context Protocol). El objetivo es que el agente tenga más fuentes de contexto y más capacidad de actuación.
Gracias a estos plugins, Codex puede recopilar información de diferentes servicios y actuar sobre ellos desde un único espacio de trabajo. Puede revisar incidencias en GitLab, consultar datos en un entorno de Databricks, actualizar documentos de Office o interactuar con servicios de despliegue, sin obligar al usuario a ir saltando de plataforma en plataforma.
En el terreno puramente técnico, la actualización refuerza los flujos de trabajo típicos de los desarrolladores. Ahora Codex ayuda a revisar solicitudes de extracción (pull requests), manejar varias pestañas de terminal a la vez, conectarse a entornos de desarrollo remoto mediante SSH y abrir archivos con vistas previas enriquecidas, ya sean PDFs, hojas de cálculo, presentaciones o documentos en otros formatos.
Todo ello se concentra en una experiencia unificada que, según la propia OpenAI, permite avanzar más rápido en todas las etapas del ciclo de vida del software: desde escribir el código inicial hasta probarlo, desplegarlo, documentarlo y mantenerlo, con los agentes de IA colaborando de forma continua dentro del mismo entorno de escritorio.
Disponibilidad, enfoque en desarrolladores y situación en Europa
La nueva versión de Codex se está desplegando ya en la aplicación de escritorio para macOS para quienes inicien sesión con una cuenta de ChatGPT. No todas las funciones requieren el mismo tipo de suscripción, y algunas características avanzadas pueden depender del plan contratado, como ocurre con otras herramientas de OpenAI.
Thibault Sottiaux, director de Codex, ha explicado que esta actualización está especialmente orientada a desarrolladores, aunque la intención es ampliarla más adelante a un público más general. La idea es que los equipos técnicos sean los primeros en aprovechar los nuevos agentes y flujos de trabajo automatizados y, con el tiempo, trasladar ese modelo a tareas de oficina, gestión de documentos o productividad personal.
OpenAI subraya que el uso del ordenador y la memoria se implementan con un enfoque de seguridad y cumplimiento normativo, algo especialmente relevante en la Unión Europea y Reino Unido. Por esa razón, las funciones de personalización avanzada, sugerencias contextuales, memoria persistente y control directo del sistema operativo tardarán algo más en activarse en estos mercados.
En cualquier caso, la compañía sostiene que esta evolución de Codex abre la puerta a una superaplicación de escritorio centrada en la automatización inteligente, donde los agentes de IA no solo ayudan a escribir código, sino que coordinan tareas, se adaptan al estilo de trabajo del usuario y mantienen activos proyectos complejos durante periodos prolongados. Para quienes desarrollan software en Europa, el mensaje es claro: las nuevas capacidades llegarán, pero con los ajustes necesarios para encajar en el marco regulatorio vigente.