GPT-Image-1.5 : la nouvelle génération de génération d’images par IA

ChatGPT Images bénéficie d’une mise à jour majeure

OpenAI lance une nouvelle génération de fonctionnalités d’image dans ChatGPT et améliore nettement la vitesse, la précision et la liberté créative.

Nouveau modèle d’image comme base

Au cœur de cette mise à jour se trouve un nouveau modèle d’image, disponible à la fois dans ChatGPT et via l’API sous le nom
gpt-image-1.5.
Il s’agit à ce jour du modèle texte-vers-image généraliste le plus performant d’OpenAI.
Selon l’entreprise, les images sont générées jusqu’à quatre fois plus vite qu’auparavant, ce qui accélère nettement les itérations
et rend le travail créatif plus fluide.

GPT-Image-1
Exemple GPT-Image-1
GPT-Image-1.5
Exemple GPT-Image-1.5

Prompt : Scène moderne de grande ville au coucher du soleil, photoréaliste,
architecture en verre, foule nombreuse, bus électrique autonome avec une publicité épurée
pour « ImageGen 1.5 » et le sous-titre « Create what you imagine », style photo de smartphone haut de gamme.

Retouches plus précises avec des détails stables

Un progrès majeur concerne la retouche d’images existantes. Les modifications sont désormais appliquées de façon plus ciblée,
tandis que les éléments non concernés, comme la lumière, la composition ou l’apparence des personnes, restent stables.
Cette cohérence s’applique non seulement à une seule étape, mais aussi sur plusieurs retouches successives.

De nombreux types de retouches possibles

Le modèle prend en charge l’ajout, la suppression, le remplacement, la combinaison et le mélange de contenus visuels.
L’objectif est d’effectuer les ajustements souhaités sans dénaturer l’image ni perdre de détails importants,
ce qui se révèle particulièrement fiable sur des scènes complexes.

Transformations créatives sans barrière de prompt

GPT-Image-1.5 progresse également dans les réinterprétations créatives.
Le texte, la mise en page ou le style peuvent être modifiés ou enrichis tout en conservant
les caractéristiques centrales de l’image.

De nouveaux styles prédéfinis et idées d’inspiration peuvent être sélectionnés directement
dans la nouvelle interface Images, sans devoir rédiger de longs prompts.

Meilleure exécution des instructions

Comparé à la première génération, le nouveau modèle suit les instructions de manière nettement plus fiable,
qu’il s’agisse de modifications très précises ou de compositions complexes avec de nombreux objets.

Grands progrès dans le rendu du texte

Le rendu du texte dans les images a été fortement amélioré.
GPT-Image-1.5 reproduit bien mieux les textes denses ou de petite taille,
permettant la création réaliste de journaux, affiches ou infographies.

Nouvelle section Images dans ChatGPT

OpenAI introduit une section dédiée aux images dans ChatGPT, accessible via la barre latérale
et sur chatgpt.com.
Elle propose des filtres prédéfinis et des prompts d’inspiration régulièrement mis à jour.

ChatGPT Images

Améliorations supplémentaires de la qualité

Le modèle améliore également le rendu de nombreux petits visages,
la netteté dans les scènes complexes et le réalisme général des résultats.

ChatGPT Images dans un contexte professionnel

Pour les entreprises, cette mise à jour offre des avantages concrets :
génération plus rapide, retouches précises et cohérence visuelle.
Les domaines d’application incluent le marketing, le design, l’e-commerce et la communication interne.

Des progrès avec une vision réaliste des limites

Malgré des améliorations significatives, certains cas complexes ou scientifiques
peuvent encore présenter des imprécisions.

GPT-Image-1.5 dans l’API

La version API bénéficie des mêmes améliorations, notamment une meilleure stabilité
des logos et éléments visuels clés sur plusieurs itérations.
Les coûts d’entrée et de sortie d’images sont environ 20 % inférieurs à ceux de GPT-Image-1.

Premiers retours du terrain

Les entreprises soulignent la qualité élevée des images, la fiabilité de l’exécution
des consignes et la cohérence de la composition et de l’éclairage.

Disponibilité et positionnement

GPT-Image-1.5 est déployé mondialement pour tous les utilisateurs de ChatGPT
et les clients API, sans sélection manuelle du modèle.


Publié

dans

par