• Logo Picasso IA
    Logo Picasso IA
  • Accueil
  • IA Image
    Nano Banana 2
  • IA Vidéo
    Veo 3.1 Lite
  • IA Chat
    Gemini 3 Pro
  • Modifier les Images
  • Améliorer l'Image
  • Supprimer l'Arrière-plan
  • Texte en Parole
  • Effets
    NEW
  • Générations
  • Facturation
  • Support
  • Compte
  1. Collection
  2. Texte en Vidéo
  3. Controlvideo

Restylisez n'importe quelle vidéo avec du texte en utilisant ControlVideo

ControlVideo est un modèle texte-vers-vidéo qui restylise des vidéos existantes en suivant la structure d'une vidéo source tout en appliquant le look et le contenu que vous décrivez dans un texte. Si vous avez un clip d'une personne qui marche et que vous voulez qu'il ressemble à une peinture à l'huile, un croquis, ou une scène dans un lieu différent, vous le décrivez et le modèle fait le reste. Il lit les données de profondeur, d'arête, ou de pose de votre vidéo d'origine pour que la nouvelle sortie reste synchronisée avec le mouvement. Le modèle supporte trois modes de structure : cartes de profondeur, détection d'arête Canny, et estimation de pose. Le mode profondeur préserve les relations tridimensionnelles entre les objets, le mode arête suit les silhouettes et contours, et le mode pose suit les positions du corps chez les sujets humains. Vous contrôlez la proximité avec laquelle la sortie suit votre texte versus la structure d'origine en utilisant l'échelle de guidage, et vous pouvez produire des clips plus longs en activant l'échantillonneur hiérarchique. Il s'adapte à tout flux de travail de contenu vidéo où vous avez besoin d'un style visuel différent sans refilmer. Les animateurs peuvent restyliser les vidéos de référence, les responsables marketing peuvent adapter les clips avec de nouvelles esthétiques, et les créateurs peuvent itérer sur une seule prise jusqu'à ce que le look soit bon. Ouvrez ControlVideo sur Picasso IA, collez votre texte, et exécutez-le.

Cjwbw

2.4k exécutions

Controlvideo

2023-05-27

Usage commercial

Table des matières

  • Vue d'ensemble
  • Comment ça marche
  • Questions fréquemment posées
  • Coût des Crédits
  • Fonctionnalités
  • Cas d'utilisation
  • Exemples
Obtenir Nano Banana Pro

Vue d'ensemble

ControlVideo vous permet de restyliser un clip vidéo existant en suivant sa structure et en appliquant le contenu visuel que vous décrivez dans un texte. Vous téléchargez un court clip, écrivez une description du look que vous voulez, et le modèle génère une nouvelle vidéo qui correspond au mouvement d'origine tout en adoptant votre style spécifié. Picasso IA exécute ControlVideo directement dans le navigateur sans installation nécessaire. Une scène d'une personne qui court peut devenir une illustration à l'aquarelle, un croquis au crayon, ou un paysage fantastique détaillé, le tout d'une seule exécution. Cela fonctionne pour l'animation, la visualisation de produits, et les tests de style créatif où vous voulez changer l'apparence d'une vidéo sans altérer la façon dont les sujets se déplacent dans le cadre.

Comment ça marche

  • Téléchargez votre fichier vidéo source à utiliser comme référence de structure
  • Écrivez un texte descriptif de l'apparence, du paramètre, ou du style visuel que vous voulez dans la sortie
  • Sélectionnez un type de condition : profondeur capture les couches spatiales, Canny trace les arêtes et contours, pose suit les positions du corps chez les sujets humains
  • Ajustez l'échelle de guidage pour définir la force avec laquelle la sortie suit votre texte versus la structure vidéo d'origine
  • Optionnellement, définissez la longueur de la sortie et activez le mode long-vidéo si vous avez besoin d'un clip plus long que les 15 images par défaut
  • Appuyez sur générer et téléchargez votre vidéo restylisée quand elle est prête

Questions fréquemment posées

Ai-je besoin de compétences en programmation ou de connaissances techniques pour utiliser ceci ? Non, ouvrez simplement ControlVideo sur Picasso IA, ajustez les paramètres que vous voulez, et appuyez sur générer.

Est-ce gratuit pour essayer ? Oui, vous pouvez exécuter ControlVideo sans abonnement pour le tester sur votre propre vidéo.

Combien de temps prend la génération ? Un clip standard de 15 images à 50 étapes de débruitage prend généralement entre 30 secondes et 2 minutes selon la charge actuelle du serveur.

Quel type de condition dois-je choisir ? La profondeur fonctionne mieux pour les scènes avec des couches spatiales claires entre le premier plan et l'arrière-plan. Canny est meilleur pour préserver les arêtes dures et les silhouettes d'objets. La pose est conçue spécifiquement pour les clips avec des figures humaines visibles se déplaçant à l'écran.

Puis-je générer des vidéos plus longues ? Oui. Activez le bouton long-vidéo dans le panneau des paramètres, et le modèle utilise un échantillonneur hiérarchique pour maintenir la cohérence des images sur toute la durée du clip.

Comment puis-je corriger les scintillements ou les incohérences de cadre ? Définissez le champ d'étapes plus lisse pour inclure les pas de temps intermédiaires pendant la génération. Cette étape réduit la dérive visuelle et les scintillements entre les images adjacentes.

Où puis-je utiliser les sorties ? Le fichier vidéo exporté n'a pas de filigrane et peut aller directement dans une publication sur les réseaux sociaux, une présentation, un démo reel, ou tout autre projet.

Coût des Crédits

Chaque génération consomme 10 crédits

10 crédits

ou 50 crédits pour 5 générations

Fonctionnalités

Tout ce que ce modèle peut faire pour vous

Aucun ajustement fin nécessaire

Exécutez le modèle sur n'importe quelle vidéo source sans configurer ou réentraîner des poids supplémentaires.

Trois modes de condition

Choisissez parmi la profondeur, l'arête Canny, ou la pose pour contrôler la façon dont la structure est extraite de la vidéo source.

Contrôle d'échelle de guidage

Ajustez la force avec laquelle la sortie suit le texte descriptif versus la structure vidéo d'origine.

Support vidéo long

Activez l'échantillonneur hiérarchique pour produire des clips étendus au-delà des 15 images par défaut.

Lisseur temporel

Réduisez les scintillements et les incohérences de cadre en définissant les étapes de lissage pendant la génération.

Reproductibilité des semences

Réutilisez la même semence pour reproduire des sorties identiques pour une comparaison côte à côte.

Longueur de sortie flexible

Définissez la durée du clip pour correspondre à vos besoins spécifiques de production ou de publication.

Option de graine aléatoire pour des sorties variées

Cas d'utilisation

Restylisez un clip de marche ou de course en une esthétique peinte ou illustrée en tapant une description du look cible

Convertissez une vidéo de mouvement humain du monde réel en une animation stylisée en sélectionnant le suivi de structure basé sur la pose

Appliquez un nouveau traitement visuel cohérent à un court clip sans modifier aucun mouvement de caméra ou de sujet d'origine

Testez plusieurs styles visuels sur la même vidéo source en exécutant différents textes descriptifs contre la même vidéo

Générez un clip d'environnement stylisé en téléchargeant une vidéo guidée par profondeur et en décrivant la scène que vous voulez

Produisez un clip plus long restylisé à partir d'une vidéo source courte en utilisant le mode long-vidéo hiérarchique

Utilisez le mode Canny edge pour préserver les contours d'objets tout en changeant complètement les textures de surface et la palette de couleurs

Améliorer le contenu des réseaux sociaux avec des visuels uniques

Exemples

2m 56s
Condition: canny
Video Length: 24
Is Long Video: Yes
Guidance Scale: 12.5
Smoother Steps: 25
Num Inference Steps: 50

A white swan movingon the lake, cartoon style.

1m 38s
Condition: pose
Video Length: 15
Is Long Video: Yes
Guidance Scale: 12.5
Smoother Steps: 19, 20
Num Inference Steps: 50

James bond moonwalk on the beach, animation style.

3m 9s
Condition: depth
Video Length: 15
Guidance Scale: 12.5
Smoother Steps: 19, 20
Num Inference Steps: 50

A striking mallard floats effortlessly on the sparkling pond.

Changer de Catégorie

Effets

Texte en image

Texte en image

Texte en vidéo

Grands Modèles de Langage

Grands Modèles de Langage

Texte en parole

Texte en parole

Super résolution

Super résolution

Synchronisation labiale

Génération de musique IA

Génération de musique IA

Édition vidéo

Parole en texte

Parole en texte

Amélioration vidéo IA

Suppression d'arrière-plan

Suppression d'arrière-plan