ChatGPT lanza un nuevo motor de creación de imágenes para competir con Google: aprovecha su potencial de esta manera

La inteligencia artificial conversacional es una herramienta muy poderosa, pero necesita que le demos instrucciones adecuadas para que nos ayude lo mejor posible

ChatGPT, el chatbot de inteligencia artificial creado por OpenAI, en la pantalla de un móvil.

mundissima / Alamy Stock Photo

ChatGPT, el chatbot de inteligencia artificial creado por OpenAI, en la pantalla de un móvil.

David Ildefonso Trabada

Madrid - Publicado el

4 min lectura

En plena aceleración de la carrera por la inteligencia artificial visual, OpenAI ha presentado una versión renovada de ChatGPT Images, la herramienta integrada en ChatGPT que permite generar y editar imágenes a partir de texto o de imágenes existentes. 

La actualización llega poco después del impulso competitivo que representó Nano Banana Pro, el modelo de Google con capacidades avanzadas de creación visual

¿Por qué se ha lanzado un nuevo modelo?

Durante años, el campo de generación de imágenes con IA ha avanzado a gran velocidad, con numerosas empresas tecnológicas compitiendo por ofrecer resultados más fieles a las indicaciones del usuario y con una interfaz más intuitiva. 

Herramientas como DALL-E, Stable Diffusion o las soluciones de Google han puesto énfasis tanto en la calidad visual como en la rapidez de respuestaGemini, el asistente de Google, ha supuesto una competencia feroz para el modelo de Open AI, forzando a la empresa a mejorar constantemente a ChatGPT, su producto estrella, para permanecer relevantes. 

Las manos de un jubilado sosteniendo un teléfono inteligente con el logotipo de ChatGPT en la pantalla sobre un escritorio con una computadora portátil cerca.

Alamy Stock Photo

Fotogfrafía de archivo de un hombre sosteniendo un teléfono con el icono de ChatGPT

Nano Banana Pro, el modelo de creación de imágenes de Google, fue tremendamente popular cuando se lanzó este año. Para varios usuarios, esta IA era bastante superior a la de ChatGPT, por lo que la llegada de un modelo mejorado era cuestión de tiempo: no ha pasado ni un mes del lanzamiento en España de Nano Banana Pro para que OpenAI responda con su nueva herramienta.

La llegada de GPT Image 1.5 se produce en ese contexto, con el objetivo de ofrecer un producto capaz de mirarle a la cara al de Google y que mejore aspectos que históricamente habían sido puntos débiles, como la coherencia de los detalles o la edición sucesiva de una misma imagen. 

¿Qué capacidades tiene?

El nuevo modelo puede generar y editar imágenes hasta cuatro veces más rápido que las versiones anteriores. Eso no solo reduce los tiempos de espera, sino que también facilita la iteración: ahora podemos probar distintos prompts y ajustes sin largos retrasos.

Además, ahora sigue con mayor precisión las instrucciones textuales, lo que se traduce en resultados que se acercan más a lo que se pide, conservando elementos importantes como la iluminación, los rasgos faciales o la composición general de la escena. 

GPT Image 1.5 también mejora la representación de texto dentro de las imágenes, algo especialmente útil para diseños con letras visibles, logos o pósters

Una de las novedades destacadas de esta actualización es su capacidad de edición avanzada: podemos modificar partes específicas de una imagen existente sin alterar el resto de los elementos, una función que potencia su uso en contextos creativos y profesionales. 

Esto siempre había sido algo difícil para las estos modelos. En versiones anteriores, si realizabas cambios pequeños sobre la misma imagen, la coherencia se acababa yendo al traste: resultando en imágenes muy distintas a la original, algo así como en el juego infantil del teléfono escacharrado: pequeños cambios que sucesivos que dan lugar a algo totalmente distinto a lo original.

Esto implica, por ejemplo, cambiar el atuendo de una persona, ajustar el peinado, eliminar o añadir objetos, o combinar elementos de distintas imágenes, todo preservando la coherencia visual.

Esta función puede ser muy útil tanto a diseñadores como a equipos de marketing, creadores de contenido o desarrolladores que buscan prototipos visuales rápidos

¿Cómo sacarle partido?

En primer lugar, cuanto más detallada y específica sea la instrucción, más cercano será el resultado: describir estilos, colores, expresiones o elementos concretos ayuda al modelo a acotar la interpretación. 

Imágen de elaboración propia creada con el nuevo modelo de ChatGPT

Imágen de elaboración propia creada con el nuevo modelo de ChatGPT

Por ejemplo; para esta imagen, se le ha pedido a ChatGPT que genere un cuadro al óleo realista de un campo en la sierra con montañas al fondo en un día soleado, con un camino que se dirija hacia el fondo de la foto y que su relación de aspecto sea 16:9 (rectangular)

Es decir: instrucciones específicas funcionan mucho mejor que simplemente "un cuadro de un campo". Describe la imagen, el estilo y todos los detalles clave.

Si editas imágenes existentes, especifica claramente qué elementos deben permanecer intactos y cuáles pueden cambiar evita resultados inesperados. Aunque la nueva versión es más eficaz interpretando el lenguaje natural, los prompts estructurados y con lenguaje claro y coherente siguen ofreciendo mejores resultados que descripciones ambiguas. 

En conjunto, la llegada de GPT Image 1.5 representa un paso importante en la evolución de las herramientas de creación visual con IA: más velocidad, más precisión y mejores posibilidades de edición que colocan a ChatGPT Images en una posición competitiva frente a otras soluciones del mercado, mientras se extiende su uso a ámbitos más allá del entretenimiento casual. 

Visto en ABC

Herrera en COPE

Herrera en COPE

Con Carlos Herrera

Lunes a viernes de 06:00h a 13:00h

Programas

Último boletín

5:00H | 23 FEB 2026 | BOLETÍN

Boletines COPE
Tracking