• Logo Picasso IA
    Logo Picasso IA
  • Accueil
  • IA Image
    Nano Banana 2
  • IA Vidéo
    Veo 3.1 Lite
  • IA Chat
    Gemini 3 Pro
  • Modifier les Images
  • Améliorer l'Image
  • Supprimer l'Arrière-plan
  • Texte en Parole
  • Effets
  • AI Toolkit
    NEW
  • Générations
  • Facturation
  • Support
  • Compte
Vidéos Illimitées SONT LÀ · Nano Banana 2 ET GPT Image 2.0 ILLIMITÉS JUSQU'AU 25 juinAméliorer
  1. Collection
  2. Grands Modèles de Langage (LLMs)
  3. Llama Guard 4 12b

Llama Guard 4 12B : Outil gratuit de modération de contenu par IA

Llama Guard 4 12B est un modèle de sécurité IA multimodal conçu pour classer le texte et les images comme sûrs ou dangereux. Les créateurs de contenu, les propriétaires de plateformes et les équipes qui examinent du contenu généré par les utilisateurs peuvent y soumettre n’importe quel élément d’entrée et obtenir en retour un verdict clair, ainsi que la catégorie spécifique du préjudice si l’une est détectée. Il élimine les approximations dans l’examen de contenu et vous offre un contrôle reproductible et cohérent en quelques secondes. Le modèle gère à la fois le texte et les images, en les analysant par rapport à un large ensemble de catégories de préjudice, notamment la violence, les discours haineux, le contenu sexuel et les instructions dangereuses. Vous pouvez transmettre un prompt système pour définir le niveau de rigueur du modèle, et ajuster la température ainsi que les paramètres d’échantillonnage pour contrôler la variabilité de la sortie. Chaque résultat revient avec une étiquette indiquant si le contenu est sûr, ou quelle catégorie de politique il a enfreinte. En pratique, Llama Guard 4 12B s’intègre sans friction dans n’importe quel flux de travail d’examen de contenu. Collez un commentaire, importez une capture d’écran ou fournissez un paragraphe d’un document et obtenez un verdict de sécurité en moins d’une seconde. Aucun fichier de configuration, aucune mise en place de code, ouvrez-le simplement sur Picasso IA et lancez votre premier contrôle.

Officiel

Meta

93.4k exécutions

Llama Guard 4 12b

2025-06-23

Usage commercial

Llama Guard 4 12B : Outil gratuit de modération de contenu par IA

Table des matières

  • Vue d'ensemble
  • Comment ça fonctionne
  • Questions fréquentes
  • Coût des Crédits
  • Fonctionnalités
  • Cas d'utilisation
Obtenir Nano Banana Pro

Vue d'ensemble

Llama Guard 4 12B est un classificateur de sécurité de contenu qui lit du texte ou des entrées texte-plus-image et renvoie un verdict clair de contenu sûr ou dangereux, accompagné de la catégorie de politique spécifique qui a déclenché le signalement. Si vous gérez une plateforme, développez des outils alimentés par l’IA ou modérez des soumissions d’utilisateurs, obtenir un second avis fiable sur le fait qu’un contenu franchit une limite est lent et coûteux lorsqu’on le fait manuellement. Sur Picasso IA, Llama Guard 4 12B effectue automatiquement cet examen et renvoie des jugements structurés en quelques secondes. Il vérifie des éléments tels que les discours haineux, les contenus d’automutilation et la violence graphique, afin que votre équipe puisse agir sur des signaux clairs plutôt que de tout examiner depuis zéro.

Comment ça fonctionne

  • Rédigez un prompt système qui définit la politique de sécurité que vous souhaitez voir appliquée par le modèle, y compris les catégories de violation à surveiller et le niveau de sévérité souhaité.
  • Ajoutez le texte que vous souhaitez évaluer dans le champ du prompt, et incluez éventuellement des images si vous devez vérifier du contenu visuel en plus du texte.
  • Ajustez la température et les paramètres d’échantillonnage pour contrôler la cohérence des réponses, ou laissez-les sur les valeurs par défaut pour un comportement de classification standard.
  • Envoyez la requête et recevez une sortie structurée : un verdict (sûr ou dangereux) et, lorsqu’il est dangereux, le libellé de la catégorie spécifique applicable.
  • Acheminez le résultat vers votre file de modération, votre système de journalisation ou votre flux de travail automatisé pour agir immédiatement.

Questions fréquentes

Ai-je besoin de compétences en programmation ou de connaissances techniques pour utiliser cela ? Non, ouvrez simplement Llama Guard 4 12B sur Picasso IA, ajustez les paramètres souhaités, puis lancez la génération.

Que produit réellement Llama Guard 4 12B ? Il renvoie un verdict de classification : soit "safe", soit "unsafe". Lorsque le contenu est signalé, il renvoie également la catégorie de violation spécifique, afin que vous sachiez exactement quelle règle a été déclenchée et puissiez répondre en conséquence. Cela rend la sortie exploitable plutôt que simplement binaire.

Puis-je vérifier des images en plus du texte ? Oui. Le modèle accepte une liste d’images en parallèle de votre prompt texte, ce qui vous permet d’évaluer du contenu multimodal dans une seule requête. C’est utile pour les plateformes où les utilisateurs publient à la fois du contenu écrit et des pièces jointes visuelles en même temps.

Comment personnaliser les règles appliquées par le modèle ? Vous fournissez un prompt système qui décrit la politique que le modèle doit appliquer. Vous pouvez nommer des catégories spécifiques à surveiller, définir le niveau de sévérité ou ajouter toute consigne personnalisée pertinente pour votre communauté ou votre plateforme.

Combien de temps prend une classification ? La plupart des requêtes renvoient un verdict en quelques secondes. Le temps de traitement dépend de la longueur du texte d’entrée et du nombre d’images incluses, mais les entrées courtes en texte seul sont généralement les plus rapides.

Que se passe-t-il si je ne suis pas d’accord avec un résultat de classification ? Vous pouvez affiner les critères dans votre prompt système et relancer la requête. Reformuler la description de la politique ou ajuster les seuils de violation fait souvent basculer les cas limites dans le sens attendu. Picasso IA vous permet d’itérer autant de fois que nécessaire sans atteindre de limites d’utilisation.

Où puis-je utiliser les résultats ? Le verdict et le libellé de catégorie sont en texte brut, donc vous pouvez les coller dans un tableur, les envoyer dans une file d’examen ou les utiliser comme entrée pour une autre étape d’un pipeline de contenu automatisé.

Coût des Crédits

Chaque génération consomme 1 crédit

1 crédit

ou 5 crédits pour 5 générations

Fonctionnalités

Tout ce que ce modèle peut faire pour vous

Entrée multimodale

Accepte à la fois le texte et les images dans la même requête pour des vérifications de sécurité unifiées.

Libellés de catégorie de préjudice

Retourne la catégorie de politique spécifique lorsque du contenu dangereux est détecté, pas seulement un indicateur binaire.

Prompt système personnalisable

Définissez vos propres critères de sécurité pour ajuster la rigueur du modèle à votre cas d’usage.

Contrôle de la température

Définissez la température d’échantillonnage de 0 à 2 pour rendre les verdicts plus déterministes ou plus variés.

Classification rapide

Fournit un résultat sûr ou dangereux en quelques secondes sans configuration d’infrastructure requise.

Contrôles de pénalité

Ajustez les pénalités de présence et de fréquence pour réduire les répétitions dans la sortie du modèle.

Paramètre de limite de jetons

Limitez la longueur de complétion pour garder les résultats concis et centrés sur le verdict de sécurité.

Cas d'utilisation

Vérifier un commentaire soumis par un utilisateur pour détecter des discours haineux ou du harcèlement avant sa publication sur votre plateforme

Importer une capture d’écran d’une publication sur les réseaux sociaux pour obtenir une étiquette de sécurité et la catégorie de préjudice spécifique à laquelle elle appartient

Faire passer une conversation de chatbot dans le modèle pour détecter lorsqu’un message d’utilisateur enfreint votre politique de contenu

Analyser le texte d’un ticket d’assistance pour signaler des messages potentiellement nuisibles et les transmettre à un examinateur humain

Tester si des réponses générées par IA seraient classées comme dangereuses avant qu’elles n’atteignent les utilisateurs finaux

Examiner des fiches produit ou des descriptions pour repérer des instructions dangereuses cachées dans le texte

Classer des images issues d’une file de modération et obtenir un verdict sûr ou dangereux avec la catégorie de préjudice correspondante

Changer de Catégorie

Effets

Texte en image

Texte en vidéo

Grands Modèles de Langage

Texte en parole

Super résolution

Synchronisation labiale

Génération de musique IA

Édition vidéo

Parole en texte

Amélioration vidéo IA

Suppression d'arrière-plan