GPT Image 2 — Générateur d'images IA, gratuit dans Genspark

Essayez le tout dernier modèle d'image d'OpenAI, gpt-image-2 (ChatGPT Images 2.0), dans Genspark. Décrivez ce que vous voulez et obtenez une typographie soignée, des infographies exactes et des visuels en 4K — le tout dans un même chat.

Les quatre domaines où GPT Image 2 excelle

Voici les quatre axes où gpt-image-2 surpasse clairement la génération précédente de modèles d'image. Chacun s'obtient avec une invite courte dans le chat Genspark.

Texte dans l'image quasi parfait

Texte dans l'image quasi parfait

gpt-image-2 rend du texte lisible directement dans l'image — titres, corps de texte, étiquettes, annotations — pour les scripts latin, CJK, arabe, hindi et bengali. Net, pas déformé. C'est le plus gros bond par rapport aux modèles précédents.

Édition multi-images jusqu'à 16 références

Édition multi-images jusqu'à 16 références

Joignez jusqu'à 16 images de référence en une seule requête et décrivez les modifications souhaitées : « change le fond en coucher de soleil », « passe le canapé en cuir », « garde le personnage mais redessine en style manga ». gpt-image-2 préserve ce que vous n'avez pas mentionné et ne réécrit que ce que vous avez précisé — édition au pixel près, pas une régénération complète.

Sortie 4K prête pour la production

Sortie 4K prête pour la production

Générez jusqu'à 4096×4096 pixels en une passe, suffisant pour l'impression, les fiches produits et les visuels grand format en réseaux sociaux. Choisissez la bonne palier dans le sélecteur de modèle de Genspark — 1K pour les brouillons, 4K pour la livraison finale.

CJK, arabe, hindi et bengali fluides

CJK, arabe, hindi et bengali fluides

Les scripts non latins sont enfin rendus correctement. Demandez une affiche d'événement japonaise, une carte de menu coréenne, un visuel social arabe ou une infographie en hindi — le texte dans l'image se lit naturellement, pas comme des carrés ou des pseudo-glyphes. Un vrai déblocage pour les équipes qui publient sur des marchés non anglophones.

Ce que vous pouvez générer avec une seule invite

Dans ces catégories, gpt-image-2 sort un résultat prêt à être livré dès le premier essai — pas des brouillons. Utilisez les exemples ci-dessus ou décrivez votre propre version.

Affiches événementielles

Affiches événementielles

Concerts, festivals, lancements, événements de campus. Donnez à l'IA le titre, la date, le lieu et la tonalité visuelle ; le modèle gère la typographie, la mise en page et une illustration de fond assortie en une seule passe.

Infographies avec vraies valeurs

Infographies avec vraies valeurs

Histogrammes, blocs de chiffres, schémas de processus — les nombres et étiquettes dans l'image sont bien ceux que vous avez saisis. Parfait pour les pitch decks, les en-têtes d'article et les cartes de partage social.

Kits de marque

Kits de marque

Donnez un nom et une ambiance, récupérez un logo, une palette de couleurs assortie et des échantillons typographiques présentés proprement sur une seule page. Point de départ rapide pour une identité de marque lors d'un nouveau projet ou d'un lancement.

À qui s'adresse cette page

gpt-image-2 est un modèle polyvalent, mais le saut en rendu de texte et en multilingue le rend nettement plus utile que la génération précédente pour ces profils en particulier.

📣

Marketing et publicité

Ébauchez des créations publicitaires, des affiches de lancement et des visuels de page d'accueil avec de vraies accroches, de vrais noms de produit et de vraies offres intégrés au visuel — sans étape de typographie séparée.

🎨

Designers et directeurs artistiques

Utilisez-le comme outil de concept rapide : générez cinq directions d'un coup, choisissez celle qui fonctionne, puis finissez dans Figma ou Photoshop. Le flux d'édition multi-images maintient la direction artistique cohérente sur plusieurs révisions.

🎬

Créateurs de contenu

Miniatures, jaquettes, en-têtes d'épisodes, schémas explicatifs. Décrivez l'ambiance de la chaîne une fois, réutilisez cette description sur chaque contenu pour conserver un look cohérent.

🛒

E-commerce et vendeurs

Visuels lifestyle sur fonds sans modèle, variantes couleur/matière (« même sac en cuir tan »), en-têtes saisonniers avec texte promo lisible. Le tout à partir d'une photo produit et d'une description courte.

Rendu de texte dans l'image quasi parfait

gpt-image-2 gère parfaitement les phrases longues, les mises en page multi-lignes, la typographie exacte et la ponctuation sensible à la casse. Affiches, journaux et panneaux publicitaires sortent prêts à être livrés, sans repasser manuellement sur le lettrage.

Affiche de film
Affiche de film
Une de journal
Une de journal
Panneau publicitaire
Panneau publicitaire

Réalisme basé sur la connaissance du monde

Grâce à un modèle du monde beaucoup plus profond, gpt-image-2 hallucine nettement moins que les modèles précédents. Schémas anatomiques, cartes géographiques, mises en scène d'ingrédients et structures physiques ressortent cohérents et étiquetables.

Schéma anatomique
Schéma anatomique
Infographie cartographique
Infographie cartographique
Nature morte culinaire photoréaliste
Nature morte culinaire photoréaliste

Sortie 4K prête pour la production

Jusqu'à 4096×4096 pixels en résolution native et des ratios jusqu'à 3:1, avec une netteté suffisante pour les panneaux publicitaires imprimés, les doubles pages de magazine et les emplacements publicitaires haute DPI, directement depuis le modèle.

Hero produit premium
Hero produit premium
Nature morte beauté
Nature morte beauté
Campagne automobile
Campagne automobile

Meilleur respect des consignes

Invites longues sur plusieurs paragraphes, mises en page précises, personnages nommés, tenues spécifiques et typographie au pixel près — tout tombe juste dès le premier essai. Ci-dessous, les invites mot pour mot et les résultats bruts produits par gpt-image-2.

PROMPT

Génère une fiche de tournage unique pour un protagoniste d'anime de lycée nommé Kai. La rangée du haut montre trois angles en pied étiquetés FRONT, SIDE, 3/4 BACK, dans son blazer d'uniforme bleu marine, chemise blanche, cravate rouge, pantalon gris et chaussures noires en cuir. La rangée du bas montre trois portraits tête-épaules du même personnage étiquetés HAPPY, ANGRY, SURPRISED. Cheveux, visage et tenue identiques sur les six panneaux, fond blanc neutre de fiche de référence, éclairage doux et uniforme.

OUTPUTFiche de tournage personnage six panneaux
PROMPT

Génère une maquette sobre de page produit DTC pour un sac cabas en cuir italien pleine fleur tan nommé Classic Tote de la marque North & Pine. La moitié gauche montre une seule photo hero du sac sur fond de studio crème doux. La moitié droite montre l'étiquette de marque « // NORTH & PINE », le nom du produit en serif élégant, le prix « $420 », une courte description se terminant par « Holds a 13-inch laptop. », trois pastilles rondes de couleurs étiquetées black/tan/olive, trois boutons de taille S/M/L avec M sélectionné, et un large bouton « Add to Cart » bleu marine. Typographie précise, esthétique e-commerce aérée et moderne.

OUTPUTPage produit e-commerce
PROMPT

Génère une page de manga noir et blanc en quatre cases sur une jeune femme qui reçoit une lettre manuscrite de quelqu'un qu'elle n'a pas vu depuis des années. Case 1 : elle est assise seule dans un café à Tokyo près d'une fenêtre sous la pluie, lisant la lettre, une bulle de pensée en japonais dit 彼が帰ってきた. Case 2 : un plan large extérieur du même café avec la skyline de Tokyo éclairée au néon derrière. Case 3 : un gros plan silencieux d'elle regardant par la fenêtre. Case 4 : une macro en plongée de ses mains tenant la lettre ouverte, les kanji manuscrits sont lisibles. Même design de personnage dans les quatre cases, ombres douces et cinématographiques.

OUTPUTStoryboard manga quatre cases

Édition au pixel près

Les éditions conversationnelles atterrissent chirurgicalement : fonds remplacés, tenues changées, saisons inversées — le reste de l'image ne dérive pas. Éclairage, ombres, carnation et composition restent verrouillés.

Changement de fond
Changement de fond
Changement de tenue
Changement de tenue
Changement de saison
Changement de saison

Comment utiliser GPT Image 2 dans Genspark

Décrivez ce que vous voulez01

Décrivez ce que vous voulez

Écrivez une invite courte — sujet, style, mise en page et tout texte précis à faire apparaître dans l'image. Le chat Genspark comprend le langage naturel dans 19 langues d'interface.

Choisissez le palier GPT Image 202

Choisissez le palier GPT Image 2

Dans le sélecteur de modèle, choisissez GPT Image 2 et sélectionnez la taille (1K / 2K / 3K / 4K) et la qualité (auto / low / medium / high). Commencez en 1K-medium pour des brouillons rapides ; passez en 4K-high pour la livraison finale.

Générer, ajuster, télécharger03

Générer, ajuster, télécharger

Genspark renvoie l'image en quelques secondes. Pas tout à fait ça ? Continuez la conversation — envoyez une instruction d'édition comme « remonte le titre » ou joignez une référence, et le modèle réécrit juste cette partie.

Questions fréquentes

GPT Image 2 est-il gratuit sur Genspark ?

Oui — chaque compte Genspark reçoit chaque jour 100 crédits gratuits auto-rechargés, utilisables directement avec gpt-image-2. Les niveaux 1K les plus légers (par exemple 1K-low à 5 crédits par image) tiennent dans l'enveloppe quotidienne. Pour un usage intensif ou des niveaux comme 4K-high, les plans Plus et Pro offrent un solde mensuel de crédits beaucoup plus large.

Quelle est la différence entre GPT Image 2 et ChatGPT Images 2.0 ?

C'est la même chose. ChatGPT Images 2.0 est le nom produit vu par les utilisateurs dans ChatGPT, gpt-image-2 est le nom du modèle côté API. Genspark appelle l'API directement, vous utilisez donc exactement le même modèle sous-jacent.

Puis-je éditer une photo existante avec GPT Image 2 ?

Oui. Joignez jusqu'à 16 images de référence dans le chat et décrivez le changement souhaité. gpt-image-2 gère les éditions au pixel près — changements de fond, changements de matière, ajout ou suppression d'éléments — tout en préservant les parties que vous n'avez pas mentionnées.

Quelles tailles et qualités sont prises en charge ?

Quatre paliers de taille (1K / 2K / 3K / 4K, jusqu'à 4096×4096) et quatre niveaux de qualité (auto / low / medium / high). La valeur par défaut 1K-medium offre un bon équilibre vitesse / netteté ; passez à 4K-high pour l'impression, les fiches produits ou les visuels grand format.

GPT Image 2 rend-il vraiment correctement le chinois, le japonais, le coréen, l'arabe et le hindi ?

Oui. Le rendu des scripts non latins est l'une des améliorations phares de cette génération — la précision est proche du niveau des scripts latins. Demandez une affiche d'événement japonaise, une carte de menu coréenne ou un visuel d'annonce en arabe, le texte dans l'image se lit naturellement.

GPT Image 2 peut-il générer des personnages sous copyright comme Pikachu, Disney ou Mario ?

Non. OpenAI bloque la génération de IP protégées au niveau du modèle. Utilisez à la place des descriptions génériques et originales — « une créature jaune type souris électrique », « un plombier héros à casquette rouge dans un royaume cartoon » — et le modèle crée un personnage original dans cet esprit.