OpenAI ha dado un salto importante en la evolución de ChatGPT como herramienta visual con el estreno de un nuevo motor de generación y edición de imágenes. La compañía quiere recortar distancias con las propuestas de Google, integradas en Gemini, y reforzar la posición de su chatbot en un terreno donde la competencia cada vez aprieta más.
Este nuevo sistema, conocido como GPT Image 1.5, ya se está desplegando en la interfaz de ChatGPT y a través de la API. El objetivo es claro: ofrecer imágenes más rápidas, más realistas y, sobre todo, mucho más controlables en procesos de edición, tanto para usos personales como para entornos profesionales en diseño, marketing o comercio electrónico.
Un motor más rápido y preparado para competir
El nuevo modelo de OpenAI supone un salto notable en rendimiento y eficiencia. Según la propia compañía, GPT Image 1.5 es capaz de generar imágenes hasta cuatro veces más rápido que la generación anterior, lo que se nota en trabajos donde es necesario iterar muchas variantes en poco tiempo.
Esta mejora de velocidad se acompaña de una optimización de costes en la API. El precio de entrada y salida de imágenes se ha reducido en torno a un 20% frente a GPT Image 1, de modo que desarrolladores, agencias y plataformas que integren el modelo pueden producir mayor volumen de contenido visual con el mismo presupuesto.
El movimiento llega en un momento de competencia intensa con Google. Gemini 3 y su motor de imágenes Nano Banana (y su variante Nano Banana Pro) han recibido buenas críticas por su capacidad para mezclar imágenes, interpretar instrucciones en lenguaje natural y generar texto integrado. Este contexto ha llevado a Sam Altman, CEO de OpenAI, a declarar internamente una situación de «código rojo» para acelerar la mejora de ChatGPT en todas sus capacidades.
En paralelo, OpenAI continúa afinando sus modelos de lenguaje, con versiones como GPT-5.2 orientadas a reforzar el rendimiento del chatbot en programación, ciencias y tareas laborales avanzadas. El nuevo motor visual encaja en esa misma estrategia de convertir ChatGPT en una plataforma de productividad completa, más que en un simple generador de textos.
Edición quirúrgica y mayor consistencia en las imágenes
Donde GPT Image 1.5 marca la diferencia es en su capacidad de edición precisa. Hasta ahora, modificar una imagen generada por IA era, en muchos casos, una lotería: pedir un cambio pequeño podía desencadenar una alteración completa de la escena, desde la iluminación hasta los rostros.
Con el nuevo modelo, ChatGPT es capaz de aplicar cambios muy concretos manteniendo el resto de la imagen prácticamente intacto. El usuario puede solicitar, por ejemplo, que solo se modifique el color de una prenda, se añada un logotipo en una zona específica o se altere un elemento del fondo, conservando la composición, la atmósfera y la identidad de las personas retratadas.
Esta mejora en la comprensión de instrucciones complejas, incluso cuando implican varios pasos, permite un control más fino en flujos de trabajo profesionales. El modelo preserva con más fidelidad rasgos faciales, proporciones, iluminación, sombras y estilo general, algo especialmente relevante en fotografías de producto, campañas publicitarias o contenidos para redes sociales.
Otro punto clave es la consistencia entre versiones. GPT Image 1.5 mantiene personajes, estilos visuales y elementos de marca coherentes a lo largo de diferentes escenas o iteraciones. Esto facilita proyectos como cómics, storyboards, catálogos de producto o materiales corporativos donde es crucial que el aspecto no cambie de una imagen a otra.
OpenAI destaca, además, la mejor preservación de logotipos y elementos corporativos. Para empresas, agencias de marketing o comercios electrónicos en España y Europa, esta estabilidad visual permite generar variantes de anuncios, banners o fichas de producto sin tener que corregir constantemente errores de identidad de marca.
Del retoque fotográfico al estudio creativo completo
Más allá del simple retoque, GPT Image 1.5 se posiciona como un motor versátil para flujos creativos complejos. El modelo admite desde pruebas virtuales de ropa o peinados hasta maquetas de productos, cambios de estilo artístico, ajustes de iluminación avanzados o la creación de fondos y escenas nuevas a partir de referencias existentes.
Un área en la que el salto es especialmente evidente es el manejo del texto dentro de las imágenes. Históricamente, los generadores de imágenes basados en IA han tenido problemas para producir letras legibles y coherentes, sobre todo si eran pequeñas o estaban muy juntas. GPT Image 1.5 mejora de forma notable este punto: puede renderizar tipografías densas, texto diminuto o composiciones complejas manteniendo una legibilidad razonable.
Eso abre la puerta a usos como la creación de infografías, señalética, interfaces de usuario, carteles o gráficos de marketing directamente desde ChatGPT, sin necesidad de retoques intensivos con software tradicional. También facilita la traducción y sustitución de textos en imágenes, una función interesante para empresas europeas que trabajan en varios idiomas.
En el plano estético, el nuevo motor apunta a un mayor realismo y credibilidad. Las texturas se perciben más naturales, los materiales están mejor definidos y la iluminación resulta más coherente, tanto en escenas cotidianas como en composiciones comerciales más pulidas. Además, el modelo mejora la generación de rostros múltiples en una misma escena, un desafío habitual donde antes eran frecuentes las distorsiones o rasgos inconsistentes.
Todo ello convierte a ChatGPT en algo más que un generador de imágenes desde cero: se acerca cada vez más a un editor competente y flexible, capaz de integrarse en procesos de preproducción y postproducción visual sin salir del propio chatbot.
Una nueva sección de imágenes dentro de ChatGPT
La renovación no se limita al modelo técnico. OpenAI ha rediseñado la experiencia de usuario en ChatGPT para dar más protagonismo a la parte visual. En la barra lateral, tanto en la versión web como en las aplicaciones móviles, aparece ahora un espacio específico dedicado a las imágenes.
Este apartado funciona como un pequeño estudio creativo integrado en el propio ChatGPT. Desde ahí, los usuarios pueden acceder a filtros preconfigurados, sugerencias de tendencias visuales y plantillas que permiten empezar a crear sin necesidad de redactar prompts extensos o demasiado técnicos.
La interfaz también permite subir fotografías desde el ordenador o el móvil para editarlas directamente. Es posible solicitar desde cambios sutiles —variaciones de iluminación, correcciones de color, pequeños ajustes estéticos— hasta transformaciones más profundas, como modificar la expresión facial de una persona, añadir elementos nuevos o cambiar completamente el ambiente de la escena.
Otra mejora práctica es que ChatGPT puede trabajar en paralelo generando imágenes mientras otras todavía se están procesando. Esta capacidad resulta útil para creadores de contenido, diseñadores y equipos de marketing que necesitan producir varias propuestas de forma continua.
OpenAI está desplegando esta nueva sección de forma progresiva. La mayoría de usuarios ya pueden acceder a ella, mientras que las cuentas Business y Enterprise recibirán el nuevo entorno visual de manera escalonada. En cualquier caso, el modelo GPT Image 1.5 ya funciona en segundo plano para todos, sin necesidad de seleccionarlo manualmente.
Despliegue global, API y foco profesional
GPT Image 1.5 se está implementando a nivel global tanto en la interfaz estándar de ChatGPT como en la API de OpenAI, bajo ese mismo nombre. Los desarrolladores pueden probarlo en el OpenAI Playground y consultar guías de prompts específicas para exprimir mejor sus capacidades visuales.
Empresas y startups de distintos sectores —especialmente en comercio electrónico, marketing digital y herramientas creativas— ya están integrando el nuevo modelo en sus productos y servicios. Entre los usos que se están explorando destacan la generación de catálogos completos a partir de una sola imagen de referencia, la creación de variaciones de producto en diferentes contextos o estilos, y la producción de contenidos visuales coherentes con la identidad de marca.
Plataformas de diseño y creación como Wix, Canva o Figma, y herramientas como Adobe Photoshop, han comenzado a incorporar estas capacidades para ofrecer a sus usuarios flujos de trabajo más fluidos, donde la IA se encarga de producir versiones y propuestas mientras el profesional se centra en la parte estratégica y creativa.
La reducción de costes en la API pretende favorecer una adopción más masiva en la industria europea, donde muchas pymes y agencias buscan soluciones que les permitan producir contenido visual de calidad sin disparar el presupuesto. Este modelo encaja especialmente bien en entornos donde se necesitan muchas variaciones de un mismo recurso, como tiendas online, campañas de redes sociales o pruebas A/B de anuncios, incluyendo el redimensionado masivo de imágenes.
En paralelo, OpenAI mantiene disponible la versión anterior de su editor de imágenes como GPT personalizado para quienes prefieran seguir usando el flujo de trabajo previo, de forma que la transición pueda hacerse de manera gradual según las necesidades de cada equipo.
La renovación del motor de imágenes de ChatGPT y la nueva interfaz dedicada consolidan el giro de la plataforma hacia un rol más amplio: de simple asistente conversacional a entorno integral de creación y edición de contenidos. Para usuarios en España y el resto de Europa, esto se traduce en una herramienta más versátil, que combina texto, búsqueda, voz, imágenes y, cada vez más, funciones avanzadas de edición sin salir de la misma aplicación.