• Logo Picasso IA
    Logo Picasso IA
  • Accueil
  • IA Image
    Nano Banana 2
  • IA Vidéo
    Veo 3.1 Fast
  • IA Chat
    Gemini 3 Pro
  • Modifier les Images
  • Améliorer l'Image
  • Supprimer l'Arrière-plan
  • Texte en Parole
  • Effets
    NEW
  • Générations
  • Facturation
  • Support
  • Compte
  1. Collection
  2. Grands Modèles de Langage (LLMs)
  3. Granite Vision 3.3 2b

Lire des graphiques et des tableaux avec Granite Vision 3.3 2B

Granite Vision 3.3 2B est un modèle compact de vision-langage conçu pour une tâche bien précise : lire des documents visuels et en extraire le sens. Si votre flux de travail consiste à extraire des données de graphiques, tableaux, infographies ou diagrammes techniques, ce modèle se charge de l’extraction pour vous, sans copie manuelle ni transcription. Fournissez-lui l’image d’un tableau financier et demandez des valeurs de lignes spécifiques. Pointez-le vers un graphique scientifique et demandez une description en langage clair de chaque section. Ajoutez une capture d’écran d’une infographie dense et demandez quelles en sont les principales données. Le modèle lit la structure visuelle, interprète les données et renvoie une réponse textuelle ciblée à votre question. Il s’intègre naturellement dans les flux de travail riches en documents, où la lecture manuelle est lente et sujette aux erreurs. Téléversez une capture d’écran, saisissez votre question et obtenez la réponse en quelques secondes. Si la première réponse n’est pas correcte, ajustez la température ou affinez votre prompt, puis relancez. Aucun paramétrage requis au-delà du choix de votre image.

Officiel

Ibm Granite

197.6k exécutions

Granite Vision 3.3 2b

2025-07-14

Usage commercial

Lire des graphiques et des tableaux avec Granite Vision 3.3 2B

Table des matières

  • Vue d’ensemble
  • Comment cela fonctionne
  • Foire aux questions
  • Coût des Crédits
  • Fonctionnalités
  • Cas d'utilisation
Obtenir Nano Banana Pro

Vue d’ensemble

Granite Vision 3.3 2B est un modèle compact de vision-langage conçu pour lire et extraire des informations structurées à partir de documents visuels, résolvant un problème que les outils textuels standards ne peuvent pas traiter : donner du sens à des tableaux, graphiques, infographies, tracés et diagrammes sous forme de données exploitables. Imaginez un analyste financier extrayant des chiffres trimestriels d’un rapport numérisé, ou un chercheur transcrivant un schéma de méthodologie sans retaper une seule cellule à la main. Sur Picasso IA, vous téléversez une image et rédigez une question en langage simple, et le modèle renvoie en quelques secondes une réponse ciblée et lisible. Avec 2 milliards de paramètres, il reste rapide sans sacrifier la précision qu’exige le travail d’extraction documentaire.

Comment cela fonctionne

  • Téléversez une ou plusieurs images de documents : pages numérisées, captures de graphiques, diapositives de présentation ou exports de diagrammes
  • Rédigez un prompt décrivant exactement ce dont vous avez besoin, par exemple "résumez les données de ce graphique en barres" ou "extrayez toutes les valeurs de lignes du tableau sur cette page"
  • Ajoutez éventuellement un prompt système pour contrôler la structure de la réponse, par exemple en demandant une sortie JSON, une liste numérotée ou un tableau markdown
  • Ajustez la température et le nombre maximal de jetons si vous avez besoin de réponses factuelles plus précises ou de réponses formatées plus longues
  • Soumettez la demande et recevez le contenu extrait ou la réponse structurée dans le panneau de sortie en quelques secondes

Foire aux questions

Ai-je besoin de compétences en programmation ou de connaissances techniques pour utiliser cela ? Non, ouvrez simplement Granite Vision 3.3 2B sur Picasso IA, ajustez les paramètres souhaités et cliquez sur générer.

Est-ce gratuit à essayer ? Oui, vous pouvez exécuter Granite Vision 3.3 2B sans coût initial. Consultez la section tarifs sur Picasso IA pour en savoir plus sur le fonctionnement des crédits de génération.

Combien de temps faut-il pour obtenir des résultats ? La plupart des demandes renvoient une réponse en quelques secondes. Le temps de traitement dépend de la complexité de l’image et de la longueur de la sortie demandée, mais la taille de 2B paramètres permet de rester rapide par rapport aux modèles de vision plus grands.

Quels types d’images gère-t-il le mieux ? Il fonctionne bien avec les tableaux, graphiques à barres, diagrammes circulaires, infographies, diagrammes techniques, nuages de points et diapositives riches en texte. Il fonctionne aussi bien avec des images numériques propres qu’avec des scans modérément compressés.

Quels formats de sortie puis-je obtenir ? Le modèle renvoie du texte brut par défaut. Vous pouvez façonner le format via votre prompt : demandez un tableau markdown, un objet JSON, une liste numérotée ou un court paragraphe, et il respectera la structure que vous décrivez.

Puis-je envoyer plusieurs images dans une seule requête ? Oui. Le modèle accepte un tableau d’entrées d’images, vous pouvez donc lui fournir plusieurs pages de document à la fois et poser des questions qui s’étendent sur plusieurs d’entre elles en une seule génération.

Que faire si la sortie oublie un détail ou contient une erreur ? Essayez de reformuler votre prompt pour préciser davantage ce que vous souhaitez extraire. Réduire la température vers 0 produit généralement des réponses plus précises et axées sur les faits lorsqu’on travaille avec des données structurées.

Coût des Crédits

Chaque génération consomme 1 crédit

1 crédit

ou 5 crédits pour 5 générations

Fonctionnalités

Tout ce que ce modèle peut faire pour vous

Lecture de documents visuels

Extrait le texte, les données et le contexte des graphiques, tableaux et infographies en une seule requête.

Entrée multi-image

Envoyez plusieurs images à la fois pour traiter des documents paginés ou comparer des sources visuelles.

Longueur de sortie ajustable

Définissez des nombres minimum et maximum de jetons pour obtenir de brefs résumés ou des analyses détaillées.

Contrôle de la température

Baissez la température pour une extraction factuelle précise, augmentez-la pour des réponses plus descriptives.

Prompt système personnalisé

Définissez un rôle ou un contexte avant chaque session pour maintenir des réponses cohérentes dans tout votre flux de travail.

Top-k et échantillonnage nucleus

Ajustez la manière dont le modèle sélectionne les jetons pour obtenir des sorties plus variées ou plus ciblées.

Contrôle des séquences d’arrêt

Définissez des jetons d’arrêt personnalisés pour terminer la génération exactement là où vous en avez besoin.

Cas d'utilisation

Extrayez les valeurs d’un tableau de données dans un document numérisé en téléversant l’image et en demandant au modèle de lister chaque ligne

Demandez quelle tendance montre un histogramme ou un graphique linéaire et recevez un résumé écrit en langage clair

Décrivez le contenu d’une infographie pour convertir des informations visuelles en texte consultable et copiable

Lisez les étiquettes et les relations dans un diagramme technique en demandant au modèle d’expliquer chaque composant

Récupérez des chiffres précis à partir d’une capture d’écran de graphique financier sans lire manuellement chaque graduation

Générez une description écrite d’un graphique scientifique en téléversant l’image et en demandant les principales conclusions

Transcrivez un tableau ou un formulaire manuscrit en téléversant une photo et en demandant au modèle de lister le contenu des cellules

Changer de Catégorie

Effets

Texte en image

Texte en image

Texte en vidéo

Grands Modèles de Langage

Grands Modèles de Langage

Texte en parole

Texte en parole

Super résolution

Super résolution

Synchronisation labiale

Génération de musique IA

Génération de musique IA

Édition vidéo

Parole en texte

Parole en texte

Amélioration vidéo IA

Suppression d'arrière-plan

Suppression d'arrière-plan