• Logo Picasso IA
    Logo Picasso IA
  • Início
  • IA Imagem
    Nano Banana 2
  • IA Vídeo
    Veo 3.1 Fast
  • IA Chat
    Gemini 3 Pro
  • Editar Imagens
  • Melhorar Imagem
  • Remover Fundo
  • Texto para Fala
  • Efeitos
    NEW
  • Gerações
  • Faturamento
  • Suporte
  • Conta
  1. Coleção
  2. Modelos de Linguagem Grandes (LLMs)
  3. Granite Vision 3.3 2b

Leia gráficos e tabelas com Granite Vision 3.3 2B

Granite Vision 3.3 2B é um modelo compacto de visão e linguagem criado para uma tarefa específica: ler e interpretar documentos visuais. Se o seu fluxo de trabalho envolve extrair dados de gráficos, tabelas, infográficos ou diagramas técnicos, este modelo faz a extração para você sem cópia ou transcrição manual. Envie uma imagem de uma tabela financeira e peça valores específicos de uma linha. Aponte-o para um gráfico científico e solicite uma descrição em linguagem simples de cada seção. Insira uma captura de tela de um infográfico denso e pergunte quais são os principais números. O modelo lê a estrutura visual, interpreta os dados e retorna uma resposta textual focada à sua pergunta. Ele se encaixa naturalmente em fluxos de trabalho com muitos documentos, nos quais a leitura manual é lenta e sujeita a erros. Carregue uma captura de tela, digite sua pergunta e obtenha a resposta em segundos. Se a primeira resposta não estiver certa, ajuste a temperatura ou refine seu prompt e execute novamente. Não é necessário nenhuma configuração além de escolher sua imagem.

Oficial

Ibm Granite

197.6k execuções

Granite Vision 3.3 2b

2025-07-14

Uso comercial

Leia gráficos e tabelas com Granite Vision 3.3 2B

Índice

  • Visão geral
  • Como Funciona
  • Perguntas Frequentes
  • Custo de Créditos
  • Recursos
  • Casos de uso
Obtenha Nano Banana Pro

Visão geral

Granite Vision 3.3 2B é um modelo compacto de visão e linguagem criado para ler e extrair informações estruturadas de documentos visuais, resolvendo um problema que as ferramentas de texto padrão não conseguem: interpretar tabelas, gráficos, infográficos, plots e diagramas como dados utilizáveis. Pense em um analista financeiro extraindo números trimestrais de um relatório digitalizado, ou em um pesquisador transcrevendo um diagrama de metodologia sem redigitar manualmente uma única célula. No Picasso IA, você envia uma imagem e escreve uma pergunta em linguagem simples, e o modelo retorna uma resposta focada e legível em segundos. Com 2 bilhões de parâmetros, ele continua rápido sem abrir mão da precisão exigida pelo trabalho de extração de documentos.

Como Funciona

  • Envie uma ou mais imagens de documentos: páginas digitalizadas, capturas de gráficos, slides de apresentação ou exportações de diagramas
  • Escreva um prompt descrevendo exatamente o que você precisa, como "resuma os dados neste gráfico de barras" ou "extraia todos os valores das linhas da tabela nesta página"
  • Opcionalmente, adicione um prompt de sistema para controlar a estrutura da resposta, por exemplo solicitando saída em JSON, uma lista numerada ou uma tabela markdown
  • Ajuste a temperatura e o número máximo de tokens se precisar de respostas factuais mais precisas ou respostas formatadas mais longas
  • Envie e receba o conteúdo extraído ou a resposta estruturada no painel de saída em questão de segundos

Perguntas Frequentes

Preciso de habilidades de programação ou conhecimento técnico para usar isto? Não, basta abrir Granite Vision 3.3 2B no Picasso IA, ajustar as configurações desejadas e clicar em gerar.

É grátis para testar? Sim, você pode executar Granite Vision 3.3 2B sem custo inicial. Consulte a seção de preços no Picasso IA para detalhes sobre como funcionam os créditos de geração.

Quanto tempo leva para obter resultados? A maioria das solicitações retorna em poucos segundos. O tempo de processamento depende da complexidade da imagem e do tamanho da saída que você solicitou, mas o tamanho de 2B parâmetros mantém tudo rápido em comparação com modelos de visão maiores.

Que tipos de imagens ele lida melhor? Ele tem bom desempenho com tabelas, gráficos de barras, gráficos de pizza, infográficos, diagramas técnicos, gráficos de dispersão e slides com muito texto. Funciona tanto com imagens digitais limpas quanto com digitalizações moderadamente comprimidas.

Quais formatos de saída posso obter? O modelo retorna texto simples por padrão. Você pode moldar o formato por meio do seu prompt: peça uma tabela markdown, um objeto JSON, uma lista numerada ou um parágrafo curto, e ele corresponderá à estrutura que você descrever.

Posso enviar várias imagens em uma única solicitação? Sim. O modelo aceita um array de entradas de imagem, então você pode inserir várias páginas de documentos de uma vez e fazer perguntas que abrangem todas elas em uma única geração.

E se a saída deixar passar um detalhe ou errar algo? Tente reformular seu prompt para ser mais específico sobre o que você deseja extrair. Diminuir a configuração de temperatura para perto de 0 normalmente produz respostas mais precisas e focadas em fatos ao trabalhar com dados estruturados.

Custo de Créditos

Cada geração consome 1 crédito

1 crédito

ou 5 créditos para 5 gerações

Recursos

Tudo o que este modelo pode fazer por você

Leitura de documentos visuais

Extrai texto, dados e contexto de gráficos, tabelas e infográficos em uma única solicitação.

Entrada de múltiplas imagens

Envie várias imagens de uma vez para processar documentos paginados ou comparar fontes visuais.

Comprimento de saída ajustável

Defina contagens mínima e máxima de tokens para obter resumos breves ou análises detalhadas.

Controle de temperatura

Reduza a temperatura para extração factual precisa, aumente-a para respostas mais descritivas.

Prompt de sistema personalizado

Defina uma função ou contexto antes de cada sessão para manter as respostas consistentes em todo o seu fluxo de trabalho.

Top-k e amostragem nucleus

Ajuste com precisão como o modelo seleciona tokens para obter saídas mais variadas ou mais focadas.

Controle de sequência de parada

Defina tokens de parada personalizados para encerrar a geração exatamente onde você precisar.

Casos de uso

Extraia os valores de uma tabela de dados em um documento digitalizado enviando a imagem e pedindo ao modelo que liste cada linha

Pergunte qual tendência um gráfico de barras ou de linhas mostra e receba um resumo escrito em linguagem simples

Descreva o conteúdo de um infográfico para converter informações visuais em texto pesquisável e copiável

Leia os rótulos e as relações em um diagrama técnico pedindo ao modelo que explique cada componente

Extraia números específicos de uma captura de tela de um gráfico financeiro sem ler manualmente cada marcação do eixo

Gere uma descrição escrita de um gráfico científico enviando a imagem e pedindo as principais conclusões

Transcreva uma tabela ou formulário manuscrito enviando uma foto e pedindo ao modelo para listar o conteúdo das células

Mudar Categoria

Efeitos

Texto para Imagem

Texto para Imagem

Texto para Vídeo

Modelos de Linguagem Extensos

Modelos de Linguagem Extensos

Texto para Fala

Texto para Fala

Super Resolução

Super Resolução

Sincronização Labial

Geração de Música com IA

Geração de Música com IA

Edição de Vídeo

Fala para Texto

Fala para Texto

Melhorar Vídeos com IA

Remover Fundos

Remover Fundos