• Logo Picasso IA
    Logo Picasso IA
  • Início
  • IA Imagem
    Nano Banana 2
  • IA Vídeo
    Veo 3.1 Lite
  • IA Chat
    Gemini 3 Pro
  • Editar Imagens
  • Melhorar Imagem
  • Remover Fundo
  • Texto para Fala
  • Efeitos
    NEW
  • Gerações
  • Faturamento
  • Suporte
  • Conta
  1. Coleção
  2. Texto para Imagem
  3. Qwen Image

Renderizar Texto em Imagens com Precisão usando Qwen Image

Qwen Image é um modelo de geração de imagens com IA construído para lidar com um dos problemas mais difíceis da arte com IA: renderizar texto legível e preciso dentro de imagens geradas. Se você precisa de um cartaz com um título legível, um gráfico de mídia social com um nome de marca ou um rótulo de produto com texto nítido, este modelo produz texto que realmente parece correto em vez dos caracteres distorcidos que a maioria dos geradores produz. O modelo aceita um prompt de texto e uma imagem de referência opcional para geração de imagem para imagem. Você pode controlar a proporção de aspecto em sete predefinições de 1:1 a 16:9, escolher entre modos de qualidade e velocidade e ajustar a escala de orientação para empurrar os resultados em direção ao realismo ou estilização. Também oferece suporte a pesos LoRA para personalização de estilo e um prompt negativo para suprimir elementos visuais indesejados. Na prática, Qwen Image se adequa em qualquer lugar onde o texto preciso na imagem importa: postagens sociais, mockups de anúncios, cartazes de eventos ou qualquer briefing criativo que misture uma cena visual com palavras legíveis. Abra o modelo no Picasso IA, digite seu prompt, escolha sua proporção de aspecto e gere em segundos sem codificação ou conta necessária.

Oficial

Qwen

473.8k execuções

Qwen Image

2025-08-04

Uso comercial

Renderizar Texto em Imagens com Precisão usando Qwen Image

Índice

  • Visão Geral
  • Como Funciona
  • Perguntas Frequentes
  • Custo de Créditos
  • Recursos
  • Casos de uso
  • Exemplos
Obtenha Nano Banana Pro

Visão Geral

Qwen Image é um modelo de IA de texto para imagem que resolve uma das lacunas mais persistentes na arte gerativa: produzir imagens onde o texto incorporado é realmente legível. A maioria dos geradores de imagens lidam mal com tipografia, produzindo caracteres distorcidos ou deformados que tornam a cópia na imagem inutilizável. Qwen Image foi projetado com um foco específico na renderização de texto complexo, o que o torna uma escolha prática para qualquer pessoa criando cartazes, gráficos de redes sociais ou elementos visuais de marca no Picasso IA. Forneça um prompt descritivo e ele retornará uma imagem onde as palavras parecem palavras.

Como Funciona

  • Escreva um prompt de texto descrevendo sua cena, incluindo qualquer texto que você deseja que apareça na imagem (por exemplo: "um cartaz de concerto para sexta-feira 18 de julho, título em branco ousado em um fundo escuro")
  • Opcionalmente, carregue uma imagem de referência para ativar o pipeline img2img e moldar o estilo visual da saída
  • Selecione sua proporção de aspecto entre sete predefinições, incluindo 1:1, 16:9, 9:16 e 4:3, para corresponder ao seu formato desejado
  • Defina a escala de orientação e o número de etapas de inferência para equilibrar o detalhe de saída contra o tempo de geração
  • Clique em gerar e baixe seu resultado em WebP, JPG ou PNG

Perguntas Frequentes

Preciso de habilidades de programação ou conhecimento técnico para usar isso? Não, basta abrir Qwen Image no Picasso IA, ajustar as configurações que desejar e clicar em gerar.

É gratuito para experimentar? Sim, você pode executar Qwen Image sem uma assinatura paga. Créditos se aplicam por geração e você pode começar no momento em que abrir a página do modelo.

Quanto tempo leva para obter resultados? A maioria das gerações é concluída em menos de 30 segundos. Ativar o modo rápido aplica otimizações adicionais que reduzem o tempo de geração com um pequeno compromisso de qualidade.

Quais formatos de saída são suportados? Você pode exportar resultados como WebP, JPG ou PNG. PNG é sem perdas e funciona melhor para impressão ou edição adicional. WebP e JPG suportam configurações de qualidade de 0 a 100.

Posso personalizar o estilo de saída? Sim. Ajuste a escala de orientação para deslocar a imagem entre fotorrealista e estilizado. Adicione um prompt negativo para excluir elementos indesejados. Carregue pesos LoRA para aplicar um estilo visual específico de forma consistente em múltiplas execuções.

O que acontece se o texto na minha imagem estiver errado ou distorcido? Tente reformular a porção de texto do seu prompt para ser mais explícito. Você também pode aumentar o número de etapas de inferência para detalhes mais nítidos e usar uma semente fixa para comparar iterações sem alterar a composição base.

Custo de Créditos

Cada geração consome 1 crédito

1 crédito

ou 5 créditos para 5 gerações

Recursos

Tudo o que este modelo pode fazer por você

Renderização de texto precisa

Gera texto legível e ortograficamente correto dentro de composições de imagem complexas.

Proporções de aspecto flexíveis

Oferece suporte a sete proporções de 1:1 a 16:9 para corresponder a qualquer plataforma ou formato de impressão.

Pipeline de imagem para imagem

Carregue uma foto de referência para moldar o estilo de saída enquanto mistura novos elementos do seu prompt.

Carregamento de estilo LoRA

Aplique pesos LoRA personalizados para bloquear um estilo visual específico em múltiplas gerações.

Ajuste de estilo

Ajuste a escala de orientação para deslocar a imagem entre resultados fotorrealistas e estilizados.

Saída em múltiplos formatos

Exporte imagens como WebP, JPG ou PNG em níveis de qualidade que você define de 0 a 100.

Melhoria de prompt

Opcionalmente, ative a melhoria automática de prompt para aguçar descrições vagas.

Ajuste fino da saída com seed, passos e força

Casos de uso

Digite um layout de cartaz em um prompt e obtenha uma imagem finalizada onde o texto do título é legível e renderizado corretamente

Gere um gráfico de mídia social que inclua um slogan de marca dentro do visual sem distorção de texto

Crie uma imagem de cartaz de evento com detalhes de data, hora e local legíveis incorporados na cena

Crie um mockup de rótulo de produto com texto estilizado e um fundo correspondente a partir de um único prompt descritivo

Gere um design de capa de livro com título e nome do autor claramente exibidos sobre um fundo ilustrado

Escreva uma cópia de anúncio curta dentro de uma cena de estilo de vida gerada por IA para uma apresentação do cliente

Carregue uma imagem de referência e adicione novos elementos de texto a ela através do pipeline de imagem para imagem

Visualização de cenas ou histórias escritas

Exemplos

16:9
webp
3.5s
Go Fast: Yes
Guidance: 4
Strength: 0.9
Image Size: optimize_for_quality
Lora Scale: 1
Enhance Prompt: No
Output Quality: 80
Num Inference Steps: 50

Bookstore window display. A sign displays “New Arrivals This Week”. Below, a shelf tag with the text “Best-Selling Novels Here”. To the side, a colorful poster advertises “Author Meet And Greet on Saturday” with a central portrait of the author. There are four books on the bookshelf, namely “The light between worlds” “When stars are scattered” “The slient patient” “The night circus”

16:9
webp
10.5s
Go Fast: Yes
Guidance: 4
Enhance Prompt: No
Output Quality: 80
Num Inference Steps: 50

A cinematic photograph of a London Underground tube station platform with the main focus on a large TfL red roundel sign reading "REPLICATE STATION" in white Johnston typeface, below it are four classic blue and white enamel directional signs in a horizontal row reading "Qwen Image," "Runway Aleph," "ByteDance OmniHuman," and "Wan 2.2" each with white directional arrows, an elegant woman in a flowing white dress stands on the platform with her long dark hair and dress caught in motion from the wind of a red tube train passing behind her in motion blur, the composition emphasizes the prominent station signage in the upper portion of the frame, characteristic curved tunnel walls with Victorian cream and burgundy tiles, warm golden tungsten lighting creating atmospheric glow, the yellow "Mind the Gap" safety line visible on the platform edge, shot with shallow depth of field focusing on the signage and woman while the moving train creates streaked motion blur in the background

16:9
webp
11.7s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A dynamic portrait photo of a woman, unusual lighting, creative composition, cyan and purple uplighting

4:3
webp
23.6s
Go Fast: No
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

a photo of a woman standing next to a poster, the poster is a beautiful typographical poster that says "Qwen-Image is now on Replicate" against a solid pink and gold background. Behind the woman it is twilight and a beach scene.

16:9
webp
15.0s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A man in a suit is standing in front of the window, looking at the bright moon outside the window. The man is holding a yellowed paper with handwritten words on it: “A lantern moon climbs through the silver night, Unfurling quiet dreams across the sky, Each star a whispered promise wrapped in light, That dawn will bloom, though darkness wanders by.” There is a cute cat on the windowsill.

1:1
webp
2m 19s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A coffee shop entrance features a chalkboard sign reading "Qwen Coffee 😊 $2 per cup," with a neon light beside it displaying "通义千问". Next to it hangs a poster showing a beautiful Chinese woman, and beneath the poster is written "π≈3.1415926-53589793-23846264-33832795-02384197". Ultra HD, 4K, cinematic composition

16:9
webp
15.1s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A slide featuring artistic, decorative shapes framing neatly arranged textual information styled as an elegant infographic. At the very center, the title “Habits for Emotional Wellbeing” appears clearly, surrounded by a symmetrical floral pattern. On the left upper section, “Practice Mindfulness” appears next to a minimalist lotus flower icon, with the short sentence, “Be present, observe without judging, accept without resisting”. Next, moving downward, “Cultivate Gratitude” is written near an open hand illustration, along with the line, “Appreciate simple joys and acknowledge positivity daily”. Further down, towards bottom-left, “Stay Connected” accompanied by a minimalistic chat bubble icon reads “Build and maintain meaningful relationships to sustain emotional energy”. At bottom right corner, “Prioritize Sleep” is depicted next to a crescent moon illustration, accompanied by the text “Quality sleep benefits both body and mind”. Moving upward along the right side, “Regular Physical Activity” is near a jogging runner icon, stating: “Exercise boosts mood and relieves anxiety”. Finally, at the top right side, appears “Continuous Learning” paired with a book icon, stating “Engage in new skill and knowledge for growth”. The slide layout beautifully balances clarity and artistry, guiding the viewers naturally along each text segment.

16:9
webp
13.7s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

Bookstore window display. A sign displays “New Arrivals This Week”. Below, a shelf tag with the text “Best-Selling Novels Here”. To the side, a colorful poster advertises “Author Meet And Greet on Saturday” with a central portrait of the author. There are four books on the bookshelf, namely “The light between worlds” “When stars are scattered” “The slient patient” “The night circus”

16:9
webp
1m 53s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着“阿里云”卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着“云存储”的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着“云计算”的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着“云模型”的牌子,门口放着一个大酒缸,上面写着“千问”,一位老板娘正在往里面倒发光的代码溶液。

16:9
webp
25.3s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A rain-slick, neon-soaked back-alley entrance. A rust-patched metal sandwich-board shows the chalkboard message in glowing white chalk: “Qwen Coffee 😊 ¥12 per cup.” A pulsing cyan neon tube spells “通义千问” in simplified Chinese characters. Next to it, a holographic poster flickers between images of a cyberpunk Chinese woman in reflective vinyl, then to scrolling digits of π that glitch every few seconds.

16:9
webp
11.6s
Go Fast: Yes
Guidance: 4
Output Quality: 80
Num Inference Steps: 50

A dynamic portrait photo of a woman

Mudar Categoria

Efeitos

Texto para Imagem

Texto para Imagem

Texto para Vídeo

Modelos de Linguagem Extensos

Modelos de Linguagem Extensos

Texto para Fala

Texto para Fala

Super Resolução

Super Resolução

Sincronização Labial

Geração de Música com IA

Geração de Música com IA

Edição de Vídeo

Fala para Texto

Fala para Texto

Melhorar Vídeos com IA

Remover Fundos

Remover Fundos