• Logo Picasso IA
    Logo Picasso IA
  • Inicio
  • IA Imagen
    Nano Banana 2
  • IA Video
    Veo 3.1 Fast
  • IA Chat
    Gemini 3 Pro
  • Editar Imágenes
  • Mejorar Imagen
  • Eliminar Fondo
  • Texto a Voz
  • Efectos
    NEW
  • Generaciones
  • Facturación
  • Soporte
  • Cuenta
  1. Colección
  2. Texto a Video
  3. Grok Imagine R2v

Grok Imagine R2V: Convierte fotos en video con IA

Grok Imagine R2V es un modelo de texto a video que utiliza imágenes de referencia para dar forma al estilo visual, la composición y el contenido de los clips generados. En lugar de depender de un solo prompt de texto para definirlo todo, subes entre una y siete imágenes que actúan como una guía visual, dando al modelo una dirección concreta sobre cómo debe verse el resultado. El modelo acepta prompts junto con tus imágenes de referencia para controlar el movimiento y la narrativa, y luego produce clips de 1 a 10 segundos en 480p o 720p. Puedes elegir entre siete relaciones de aspecto, incluyendo el formato vertical 9:16 para contenido social y el formato panorámico 16:9 para una apariencia cinematográfica. Cada ejecución se mantiene dentro de una sola interfaz, sin necesidad de conversión de archivos ni herramientas externas. Pega una foto de producto o un concepto de personaje junto con una breve descripción, establece la duración, elige una resolución y el video estará listo en cuestión de minutos. Encaja de forma natural en la producción de contenido para redes sociales, propuestas creativas en etapas tempranas y cualquier proyecto en el que necesites una imagen en movimiento pero solo tengas imágenes fijas para empezar.

Oficial

Xai

6.3k ejecuciones

Grok Imagine R2v

2026-03-23

Uso comercial

Tabla de contenidos

  • Descripción general
  • Cómo funciona
  • Preguntas frecuentes
  • Costo de Créditos
  • Características
  • Casos de uso
  • Ejemplos
Obtén Nano Banana Pro

Descripción general

Grok Imagine R2V convierte un prompt de texto y un conjunto de imágenes de referencia en un video corto, dándote control directo sobre la dirección visual antes de que comience la generación. Las imágenes de referencia no se usan como fotogramas de apertura; guían el estilo, la paleta de colores y el tema de todo el clip. Esto es útil cuando ya tienes una idea visual clara y solo necesitas que se mueva. En Picasso IA, todo el proceso se ejecuta en un navegador sin necesidad de código ni configuración. Sube tus referencias, describe la acción y el modelo construye el video combinando ambas entradas.

Cómo funciona

  • Sube entre 1 y 7 imágenes de referencia que capturen el estilo visual, el tema o la atmósfera que quieres en el video
  • Escribe un prompt de texto que describa lo que debe ocurrir: la acción, la escena o la atmósfera que tienes en mente
  • Establece la duración del video entre 1 y 10 segundos, elige la resolución (480p o 720p) y selecciona una relación de aspecto entre opciones como 16:9, 1:1 o 9:16
  • El modelo lee tu prompt y tus imágenes en conjunto, y luego genera un clip que refleja ambas entradas
  • Descarga el archivo de video finalizado directamente desde la página de resultados cuando termine el procesamiento

Preguntas frecuentes

¿Necesito habilidades de programación o conocimientos técnicos para usar esto? No, solo abre Grok Imagine R2V en Picasso IA, ajusta la configuración que quieras y pulsa generar.

¿Es gratis probarlo? Sí, puedes ejecutar Grok Imagine R2V sin una suscripción de pago para empezar. Consulta los detalles del plan actual para obtener información sobre los límites de generación y los créditos.

¿Cuánto tarda en obtenerse el resultado? La mayoría de los clips terminan en menos de dos minutos, dependiendo de la duración y la resolución que hayas seleccionado. Los videos más cortos en 480p tienden a procesarse más rápido.

¿Qué formatos de salida son compatibles? El modelo devuelve archivos de video estándar que puedes descargar directamente desde la página de resultados. Funcionan en plataformas de redes sociales, editores de video y herramientas de presentación.

¿Puedo usar varias imágenes de referencia a la vez? Sí, puedes subir hasta 7 imágenes de referencia por generación. Más imágenes le dan al modelo un contexto visual más rico, lo que a menudo mejora la consistencia del estilo en todo el clip.

¿Qué relaciones de aspecto están disponibles? Hay seis opciones disponibles: 16:9, 4:3, 1:1, 9:16, 3:4 y 3:2. Esto cubre formatos panorámicos, cuadrados y verticales, para que puedas adaptar el resultado al lugar donde se publicará.

¿Qué pasa si no estoy satisfecho con el resultado? Prueba ajustando tu prompt, cambiando las imágenes de referencia o modificando la duración y la resolución. Los pequeños cambios en el prompt a menudo producen resultados notablemente diferentes.

Costo de Créditos

Cada generación consume 10 créditos

10 créditos

o 50 créditos para 5 generaciones

Características

Todo lo que este modelo puede hacer por ti

Entrada de imágenes de referencia

Sube hasta 7 imágenes que definan el estilo visual, la composición y el contenido del video generado.

Relaciones de aspecto flexibles

Elige entre 7 proporciones, incluyendo 9:16 para contenido social vertical y 16:9 para formatos panorámicos.

Duración ajustable

Establece la duración del clip entre 1 y 10 segundos para adaptarla al formato que estás produciendo.

Dos opciones de resolución

Genera en 480p para vistas previas rápidas o en 720p para resultados más nítidos y listos para compartir.

Control mediante prompt de texto

Describe el movimiento, la escena y la atmósfera en lenguaje natural para dirigir el contenido del video.

Sin configuración necesaria

Ejecuta el modelo directamente en el navegador sin instalar software ni configurar cuentas.

Salida de archivo limpia

Descarga el video finalizado como un archivo estándar listo para cualquier editor, plataforma social o presentación.

Casos de uso

Convierte un conjunto de fotos de producto en un video promocional corto subiendo las imágenes y describiendo el movimiento que quieres

Genera un clip de video estilizado a partir de arte conceptual de personajes subiendo las ilustraciones y escribiendo una descripción de la escena

Crea un video social vertical 9:16 a partir de una sola foto de retrato describiendo el movimiento o la animación de fondo que quieres

Produce un clip cinematográfico 16:9 a partir de fotos de referencia de paisajes y una breve descripción del movimiento de cámara

Crea una vista previa rápida de storyboard subiendo bocetos preliminares y convirtiéndolos en un clip animado de 5 segundos

Genera un reel de ambiente para una propuesta de marca subiendo imágenes de inspiración y escribiendo una descripción de una línea de la atmósfera

Crea una breve introducción animada a partir de una imagen de logotipo y un prompt de texto que describa cómo debe aparecer en pantalla

Ejemplos

Entrada
Input 1
Input 2
+2Resultado
Four friends sitting together at a sun-drenched outdoor restaurant table, laughing and waving at the camera. Warm golden hour light, Mediterranean terrace setting with climbing vines and the sea in the background. Slow cinematic camera push-in, joyful and candid atmosphere
1m 51s
Ver Ejemplo
Entrada
Input 1
Input 2
+1Resultado
A grand museum gallery comes to life at night: the portrait of Kepler gazes at a rotating globe of Earth, while a butterfly specimen escapes its glass case and flutters past ancient temple artifacts. Warm museum lighting, slow tracking shot down the gallery corridor, Night at the Museum style, magical and cinematic
1m 54s
Ver Ejemplo
Entrada
Input 1
Resultado
A dramatic time-lapse of clouds rushing over the snow-capped Himalayan peaks, sunlight breaking through gaps to create god rays across the valleys, sweeping drone shot, epic nature documentary style
1m 38s
Ver Ejemplo
Entrada
Input 1
Resultado
The Earth slowly rotates in the vast emptiness of space, clouds swirling over continents, city lights twinkling on the night side, gentle camera drift, IMAX documentary style, awe-inspiring
49.9s
Ver Ejemplo
Entrada
Input 1
Input 2
Resultado
A breathtaking cinematic aerial shot sweeping over the pyramids at golden hour, with a monarch butterfly gliding through the warm desert air in the foreground, dust particles catching the light, epic scale
1m 43s
Ver Ejemplo

Cambiar Categoría

Efectos

Texto a Imagen

Texto a Imagen

Texto a Video

Modelos de Lenguaje Extensos

Modelos de Lenguaje Extensos

Texto a Voz

Texto a Voz

Super Resolución

Super Resolución

Sincronización Labial

Generación de Música con IA

Generación de Música con IA

Edición de Video

Voz a Texto

Voz a Texto

Mejorar Videos con IA

Eliminar Fondos

Eliminar Fondos