• Logo Picasso IA
    Logo Picasso IA
  • Início
  • IA Imagem
    Nano Banana 2
  • IA Vídeo
    Veo 3.1 Fast
  • IA Chat
    Gemini 3 Pro
  • Editar Imagens
  • Melhorar Imagem
  • Remover Fundo
  • Texto para Fala
  • Efeitos
    NEW
  • Gerações
  • Faturamento
  • Suporte
  • Conta
  1. Coleção
  2. Texto para Vídeo
  3. Grok Imagine R2v

Grok Imagine R2V: Transforme fotos em vídeo com IA

Grok Imagine R2V é um modelo de texto para vídeo que usa imagens de referência para definir o estilo visual, a composição e o conteúdo dos clipes gerados. Em vez de depender de um único prompt de texto para definir tudo, você envia entre uma e sete imagens que funcionam como um briefing visual, dando ao modelo uma direção concreta sobre como o resultado deve parecer. O modelo aceita prompts junto com suas imagens de referência para controlar o movimento e a narrativa, e então produz clipes de 1 a 10 segundos em 480p ou 720p. Você pode escolher entre sete proporções de tela, incluindo 9:16 vertical para formatos sociais e 16:9 widescreen para um visual cinematográfico. Cada execução acontece em uma única interface, sem necessidade de conversão de arquivos ou ferramentas externas. Cole uma foto de produto ou um conceito de personagem junto com uma descrição curta, defina a duração, escolha uma resolução, e o vídeo fica pronto em poucos minutos. Ele se encaixa naturalmente na produção de conteúdo para redes sociais, em propostas criativas em estágio inicial e em qualquer projeto em que você precise de um visual em movimento, mas só tenha imagens estáticas para começar.

Oficial

Xai

6.3k execuções

Grok Imagine R2v

2026-03-23

Uso comercial

Índice

  • Visão geral
  • Como funciona
  • Perguntas frequentes
  • Custo de Créditos
  • Recursos
  • Casos de uso
  • Exemplos
Obtenha Nano Banana Pro

Visão geral

Grok Imagine R2V transforma um prompt de texto e um conjunto de imagens de referência em um vídeo curto, dando a você controle direto sobre a direção visual antes de a geração começar. As imagens de referência não são usadas como quadros iniciais; elas orientam o estilo, a paleta de cores e o tema de todo o clipe. Isso é útil quando você já tem um visual claro em mente e só precisa fazê-lo se mover. No Picasso IA, todo o processo funciona no navegador, sem necessidade de código ou configuração. Envie suas referências, descreva a ação e o modelo cria o vídeo combinando as duas entradas.

Como funciona

  • Envie entre 1 e 7 imagens de referência que capturem o estilo visual, o tema ou o clima que você deseja no vídeo
  • Escreva um prompt de texto descrevendo o que deve acontecer: a ação, a cena ou a atmosfera que você tem em mente
  • Defina a duração do vídeo de 1 a 10 segundos, escolha a resolução (480p ou 720p) e selecione uma proporção de tela entre opções como 16:9, 1:1 ou 9:16
  • O modelo lê seu prompt e suas imagens em conjunto, depois gera um clipe que reflete ambas as entradas
  • Baixe o arquivo de vídeo finalizado diretamente da página de resultados quando o processamento for concluído

Perguntas frequentes

Preciso de habilidades de programação ou conhecimento técnico para usar isso? Não, basta abrir Grok Imagine R2V no Picasso IA, ajustar as configurações desejadas e clicar em gerar.

É gratuito para testar? Sim, você pode usar Grok Imagine R2V sem uma assinatura paga para começar. Consulte os detalhes do plano atual para obter informações sobre limites de geração e créditos.

Quanto tempo leva para obter resultados? A maioria dos clipes fica pronta em menos de dois minutos, dependendo da duração e da resolução que você selecionou. Vídeos mais curtos em 480p tendem a ser processados mais rapidamente.

Quais formatos de saída são suportados? O modelo retorna arquivos de vídeo padrão que você pode baixar diretamente da página de resultados. Eles funcionam em plataformas de mídia social, editores de vídeo e ferramentas de apresentação.

Posso usar várias imagens de referência ao mesmo tempo? Sim, você pode enviar até 7 imagens de referência por geração. Mais imagens dão ao modelo um contexto visual mais rico, o que geralmente melhora a consistência do estilo em todo o clipe.

Quais proporções de tela estão disponíveis? Seis opções estão disponíveis: 16:9, 4:3, 1:1, 9:16, 3:4 e 3:2. Isso cobre formatos widescreen, quadrado e vertical, para que você possa adequar o resultado ao local onde ele será publicado.

O que acontece se eu não gostar do resultado? Tente ajustar seu prompt, trocar por imagens de referência diferentes ou alterar as configurações de duração e resolução. Pequenas mudanças no prompt frequentemente produzem resultados visivelmente diferentes.

Custo de Créditos

Cada geração consome 10 créditos

10 créditos

ou 50 créditos para 5 gerações

Recursos

Tudo o que este modelo pode fazer por você

Entrada de imagem de referência

Envie até 7 imagens que definem o estilo visual, a composição e o conteúdo do vídeo gerado.

Proporções de tela flexíveis

Escolha entre 7 proporções, incluindo 9:16 para conteúdo social vertical e 16:9 para formatos widescreen.

Duração ajustável

Defina a duração do clipe entre 1 e 10 segundos para combinar com o formato que você está produzindo.

Duas opções de resolução

Gere em 480p para prévias rápidas ou em 720p para resultados mais nítidos e prontos para compartilhar.

Controle por prompt de texto

Descreva o movimento, a cena e a atmosfera em linguagem simples para orientar o conteúdo do vídeo.

Sem necessidade de configuração

Execute o modelo diretamente no navegador, sem software para instalar ou contas para configurar.

Saída de arquivo limpa

Baixe o vídeo finalizado como um arquivo padrão pronto para qualquer editor, plataforma social ou apresentação.

Casos de uso

Transforme um conjunto de fotos de produto em um vídeo promocional curto enviando as imagens e descrevendo o movimento que você deseja

Gere um clipe de vídeo estilizado a partir de concept art de personagem enviando as ilustrações e escrevendo uma descrição da cena

Crie um vídeo social vertical 9:16 a partir de uma única foto de retrato descrevendo o movimento ou a animação de fundo que você deseja

Produza um clipe cinematográfico em 16:9 a partir de fotos de referência de paisagem e uma descrição curta do movimento de câmera

Monte uma prévia rápida de storyboard enviando esboços brutos e transformando-os em um clipe animado de 5 segundos

Gere um mood reel para uma apresentação de marca enviando imagens de inspiração e escrevendo uma descrição de uma linha da atmosfera

Crie uma introdução animada curta a partir de uma imagem de logotipo e um prompt de texto descrevendo como ela deve aparecer na tela

Exemplos

Entrada
Input 1
Input 2
+2Resultado
Four friends sitting together at a sun-drenched outdoor restaurant table, laughing and waving at the camera. Warm golden hour light, Mediterranean terrace setting with climbing vines and the sea in the background. Slow cinematic camera push-in, joyful and candid atmosphere
1m 51s
Ver Exemplo
Entrada
Input 1
Input 2
+1Resultado
A grand museum gallery comes to life at night: the portrait of Kepler gazes at a rotating globe of Earth, while a butterfly specimen escapes its glass case and flutters past ancient temple artifacts. Warm museum lighting, slow tracking shot down the gallery corridor, Night at the Museum style, magical and cinematic
1m 54s
Ver Exemplo
Entrada
Input 1
Resultado
A dramatic time-lapse of clouds rushing over the snow-capped Himalayan peaks, sunlight breaking through gaps to create god rays across the valleys, sweeping drone shot, epic nature documentary style
1m 38s
Ver Exemplo
Entrada
Input 1
Resultado
The Earth slowly rotates in the vast emptiness of space, clouds swirling over continents, city lights twinkling on the night side, gentle camera drift, IMAX documentary style, awe-inspiring
49.9s
Ver Exemplo
Entrada
Input 1
Input 2
Resultado
A breathtaking cinematic aerial shot sweeping over the pyramids at golden hour, with a monarch butterfly gliding through the warm desert air in the foreground, dust particles catching the light, epic scale
1m 43s
Ver Exemplo

Mudar Categoria

Efeitos

Texto para Imagem

Texto para Imagem

Texto para Vídeo

Modelos de Linguagem Extensos

Modelos de Linguagem Extensos

Texto para Fala

Texto para Fala

Super Resolução

Super Resolução

Sincronização Labial

Geração de Música com IA

Geração de Música com IA

Edição de Vídeo

Fala para Texto

Fala para Texto

Melhorar Vídeos com IA

Remover Fundos

Remover Fundos