• Logo Picasso IA
    Logo Picasso IA
  • Accueil
  • IA Image
    Nano Banana 2
  • IA Vidéo
    Veo 3.1 Lite
  • IA Chat
    Gemini 3 Pro
  • Modifier les Images
  • Améliorer l'Image
  • Supprimer l'Arrière-plan
  • Texte en Parole
  • Effets
    NEW
  • Générations
  • Facturation
  • Support
  • Compte
  1. Collection
  2. Texte en Image
  3. Qwen Image

Rendre le texte dans les images avec précision avec Qwen Image

Qwen Image est un modèle de génération d'images IA conçu pour résoudre l'un des problèmes les plus difficiles de l'art IA : rendre le texte lisible et précis dans les images générées. Que vous ayez besoin d'une affiche avec un titre lisible, d'un graphique de média social avec un nom de marque, ou d'une étiquette de produit avec un texte net, ce modèle produit du texte qui semble vraiment juste au lieu des caractères brouillés que la plupart des générateurs produisent. Le modèle accepte une invite textuelle et une image de référence optionnelle pour la génération image-vers-image. Vous pouvez contrôler le rapport d'aspect sur sept préréglages de 1:1 à 16:9, choisir entre les modes qualité et vitesse, et ajuster l'échelle de guidance pour orienter les résultats vers le réalisme ou la stylisation. Il supporte également les poids LoRA pour la personnalisation du style et une invite négative pour supprimer les éléments visuels indésirables. En pratique, Qwen Image s'adapte partout où le texte précis dans l'image est important : publications sociales, maquettes publicitaires, affiches d'événements, ou tout brief créatif qui mélange une scène visuelle avec des mots lisibles. Ouvrez le modèle sur Picasso IA, tapez votre invite, choisissez votre rapport d'aspect, et générez en quelques secondes sans codage ni compte requis.

Officiel

Qwen

473.8k exécutions

Qwen Image

2025-08-04

Usage commercial

Rendre le texte dans les images avec précision avec Qwen Image

Table des matières

  • Aperçu
  • Comment ça marche
  • Questions fréquemment posées
  • Coût des Crédits
  • Fonctionnalités
  • Cas d'utilisation
  • Exemples
Obtenir Nano Banana Pro

Aperçu

Qwen Image est un modèle IA de texte vers image qui résout l'une des lacunes les plus persistantes de l'art génératif : produire des images où le texte intégré est réellement lisible. La plupart des générateurs d'images gèrent mal la typographie, produisant des caractères brouillés ou distordus qui rendent le texte dans l'image inutilisable. Qwen Image a été conçu avec un accent particulier sur le rendu complexe de texte, ce qui en fait un choix pratique pour quiconque crée des affiches, des graphiques de médias sociaux, ou des visuels de marque sur Picasso IA. Donnez-lui une invite descriptive et il retourne une image où les mots ressemblent à des mots.

Comment ça marche

  • Écrivez une invite textuelle décrivant votre scène, y compris tout texte que vous voulez voir apparaître dans l'image (par exemple : "une affiche de concert pour vendredi 18 juillet, gros titre blanc gras sur un fond sombre")
  • Téléchargez optionnellement une image de référence pour activer le pipeline img2img et façonner le style visuel de la sortie
  • Sélectionnez votre rapport d'aspect parmi sept préréglages, y compris 1:1, 16:9, 9:16, et 4:3, pour correspondre à votre format cible
  • Définissez l'échelle de guidance et le nombre d'étapes d'inférence pour équilibrer les détails de la sortie contre le temps de génération
  • Cliquez sur générer et téléchargez votre résultat en WebP, JPG, ou PNG

Questions fréquemment posées

Ai-je besoin de compétences en programmation ou de connaissances techniques pour utiliser ceci ? Non, ouvrez simplement Qwen Image sur Picasso IA, ajustez les paramètres que vous voulez, et cliquez sur générer.

Est-ce gratuit à essayer ? Oui, vous pouvez exécuter Qwen Image sans abonnement payant. Les crédits s'appliquent par génération et vous pouvez commencer dès que vous ouvrez la page du modèle.

Combien de temps faut-il pour obtenir des résultats ? La plupart des générations se terminent en moins de 30 secondes. L'activation du mode rapide applique des optimisations supplémentaires qui réduisent le temps de génération avec un léger compromis de qualité.

Quels formats de sortie sont pris en charge ? Vous pouvez exporter les résultats en WebP, JPG, ou PNG. PNG est sans perte et convient mieux pour l'impression ou l'édition ultérieure. WebP et JPG supportent tous les deux les paramètres de qualité de 0 à 100.

Puis-je personnaliser le style de sortie ? Oui. Ajustez l'échelle de guidance pour décaler l'image entre photoréaliste et stylisée. Ajoutez une invite négative pour exclure les éléments indésirables. Chargez les poids LoRA pour appliquer un style visuel spécifique de manière cohérente sur plusieurs exécutions.

Que se passe-t-il si le texte de mon image est incorrect ou déformé ? Essayez de reformuler la partie texte de votre invite pour être plus explicite. Vous pouvez également augmenter le nombre d'étapes d'inférence pour plus de netteté et utiliser une graine fixe pour comparer les itérations sans modifier la composition de base.

Coût des Crédits

Chaque génération consomme 1 crédit

1 crédit

ou 5 crédits pour 5 générations

Fonctionnalités

Tout ce que ce modèle peut faire pour vous

Rendu de texte précis

Génère du texte lisible et correctement orthographié dans les compositions d'images complexes.

Rapports d'aspect flexibles

Supporte sept ratios de 1:1 à 16:9 pour correspondre à n'importe quelle plate-forme ou format d'impression.

Pipeline image-vers-image

Téléchargez une photo de référence pour façonner le style de sortie tout en mélangeant de nouveaux éléments de votre invite.

Chargement de style LoRA

Appliquez des poids LoRA personnalisés pour bloquer un style visuel spécifique sur plusieurs générations.

Ajustement du style

Ajustez l'échelle de guidance pour décaler l'image entre les résultats photoréalistes et stylisés.

Sortie multi-format

Exportez les images en WebP, JPG, ou PNG aux niveaux de qualité que vous définissez de 0 à 100.

Amélioration des invites

Activez optionnellement l'amélioration automatique des invites pour affiner les descriptions vagues.

Affinez la sortie avec la graine, les étapes et la force

Cas d'utilisation

Tapez une mise en page d'affiche dans une invite et obtenez une image terminée où le texte du titre est lisible et correctement rendu

Générez un graphique de médias sociaux qui inclut un slogan de marque à l'intérieur du visuel sans distorsion de texte

Créez une image de tract d'événement avec la date, l'heure et les détails du lieu lisibles intégrés à la scène

Créez une maquette d'étiquette de produit avec du texte stylisé et un fond assorti à partir d'une invite descriptive unique

Générez une conception de jaquette de livre avec le texte du titre et le nom de l'auteur clairement affichés sur un fond illustré

Rédigez un court texte publicitaire à l'intérieur d'une scène de style de vie générée par IA pour une présentation client

Téléchargez une image de référence et ajoutez-y de nouveaux éléments de texte via le pipeline image-vers-image

Visualisation de scènes ou histoires écrites

Exemples

16:9
webp
3.5s
Go Fast: Yes
Guidance: 4
Strength: 0.9
Image Size: optimize_for_quality
Lora Scale: 1
Enhance Prompt: No
Output Quality: 80
Num Inference Steps: 50

Bookstore window display. A sign displays “New Arrivals This Week”. Below, a shelf tag with the text “Best-Selling Novels Here”. To the side, a colorful poster advertises “Author Meet And Greet on Saturday” with a central portrait of the author. There are four books on the bookshelf, namely “The light between worlds” “When stars are scattered” “The slient patient” “The night circus”

16:9
webp
10.5s
Go Fast: Yes
Guidance: 4
Enhance Prompt: No
Output Quality: 80
Num Inference Steps: 50

A cinematic photograph of a London Underground tube station platform with the main focus on a large TfL red roundel sign reading "REPLICATE STATION" in white Johnston typeface, below it are four classic blue and white enamel directional signs in a horizontal row reading "Qwen Image," "Runway Aleph," "ByteDance OmniHuman," and "Wan 2.2" each with white directional arrows, an elegant woman in a flowing white dress stands on the platform with her long dark hair and dress caught in motion from the wind of a red tube train passing behind her in motion blur, the composition emphasizes the prominent station signage in the upper portion of the frame, characteristic curved tunnel walls with Victorian cream and burgundy tiles, warm golden tungsten lighting creating atmospheric glow, the yellow "Mind the Gap" safety line visible on the platform edge, shot with shallow depth of field focusing on the signage and woman while the moving train creates streaked motion blur in the background

16:9
webp
11.7s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A dynamic portrait photo of a woman, unusual lighting, creative composition, cyan and purple uplighting

4:3
webp
23.6s
Go Fast: No
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

a photo of a woman standing next to a poster, the poster is a beautiful typographical poster that says "Qwen-Image is now on Replicate" against a solid pink and gold background. Behind the woman it is twilight and a beach scene.

16:9
webp
15.0s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A man in a suit is standing in front of the window, looking at the bright moon outside the window. The man is holding a yellowed paper with handwritten words on it: “A lantern moon climbs through the silver night, Unfurling quiet dreams across the sky, Each star a whispered promise wrapped in light, That dawn will bloom, though darkness wanders by.” There is a cute cat on the windowsill.

1:1
webp
2m 19s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A coffee shop entrance features a chalkboard sign reading "Qwen Coffee 😊 $2 per cup," with a neon light beside it displaying "通义千问". Next to it hangs a poster showing a beautiful Chinese woman, and beneath the poster is written "π≈3.1415926-53589793-23846264-33832795-02384197". Ultra HD, 4K, cinematic composition

16:9
webp
15.1s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A slide featuring artistic, decorative shapes framing neatly arranged textual information styled as an elegant infographic. At the very center, the title “Habits for Emotional Wellbeing” appears clearly, surrounded by a symmetrical floral pattern. On the left upper section, “Practice Mindfulness” appears next to a minimalist lotus flower icon, with the short sentence, “Be present, observe without judging, accept without resisting”. Next, moving downward, “Cultivate Gratitude” is written near an open hand illustration, along with the line, “Appreciate simple joys and acknowledge positivity daily”. Further down, towards bottom-left, “Stay Connected” accompanied by a minimalistic chat bubble icon reads “Build and maintain meaningful relationships to sustain emotional energy”. At bottom right corner, “Prioritize Sleep” is depicted next to a crescent moon illustration, accompanied by the text “Quality sleep benefits both body and mind”. Moving upward along the right side, “Regular Physical Activity” is near a jogging runner icon, stating: “Exercise boosts mood and relieves anxiety”. Finally, at the top right side, appears “Continuous Learning” paired with a book icon, stating “Engage in new skill and knowledge for growth”. The slide layout beautifully balances clarity and artistry, guiding the viewers naturally along each text segment.

16:9
webp
13.7s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

Bookstore window display. A sign displays “New Arrivals This Week”. Below, a shelf tag with the text “Best-Selling Novels Here”. To the side, a colorful poster advertises “Author Meet And Greet on Saturday” with a central portrait of the author. There are four books on the bookshelf, namely “The light between worlds” “When stars are scattered” “The slient patient” “The night circus”

16:9
webp
1m 53s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着“阿里云”卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着“云存储”的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着“云计算”的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着“云模型”的牌子,门口放着一个大酒缸,上面写着“千问”,一位老板娘正在往里面倒发光的代码溶液。

16:9
webp
25.3s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A rain-slick, neon-soaked back-alley entrance. A rust-patched metal sandwich-board shows the chalkboard message in glowing white chalk: “Qwen Coffee 😊 ¥12 per cup.” A pulsing cyan neon tube spells “通义千问” in simplified Chinese characters. Next to it, a holographic poster flickers between images of a cyberpunk Chinese woman in reflective vinyl, then to scrolling digits of π that glitch every few seconds.

16:9
webp
11.6s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A dynamic portrait photo of a woman

Changer de Catégorie

Effets

Texte en image

Texte en image

Texte en vidéo

Grands Modèles de Langage

Grands Modèles de Langage

Texte en parole

Texte en parole

Super résolution

Super résolution

Synchronisation labiale

Génération de musique IA

Génération de musique IA

Édition vidéo

Parole en texte

Parole en texte

Amélioration vidéo IA

Suppression d'arrière-plan

Suppression d'arrière-plan