• Logo Picasso IA
    Logo Picasso IA
  • Inicio
  • IA Imagen
    Nano Banana 2
  • IA Video
    Veo 3.1 Fast
  • IA Chat
    Gemini 3 Pro
  • Editar Imágenes
  • Mejorar Imagen
  • Eliminar Fondo
  • Texto a Voz
  • Efectos
    NEW
  • Generaciones
  • Facturación
  • Soporte
  • Cuenta
  1. Colección
  2. Texto a Imagen
  3. Isaac 0.1

Detecta objetos en fotos con Isaac 0.1 gratis

Isaac 0.1 es un modelo de visión de 2 mil millones de parámetros creado para leer imágenes del mundo real y devolver respuestas estructuradas y útiles. Maneja preguntas como si es seguro cruzar la calle, dónde se encuentra una señal específica y qué objetos aparecen en la imagen. En lugar de un pie de foto vago, obtienes cajas delimitadoras, coordenadas exactas, contornos poligonales o texto sin formato, según el formato que mejor se adapte a tu tarea. El modelo lee una imagen junto con un prompt en lenguaje natural y devuelve el tipo de salida que elijas. Solicita cajas delimitadoras para obtener regiones rectangulares dibujadas alrededor de los objetos detectados. Solicita polígonos para contornos precisos de la forma, o coordenadas para posiciones exactas de píxeles. Si prefieres texto sin formato, obtienes una respuesta escrita breve directamente. Los cuatro modos de respuesta funcionan a partir de la misma entrada de imagen y prompt. Un verificador de seguridad vial, un paso de control de calidad en un flujo de trabajo de fotos, un escáner de documentos que localiza regiones en una página o un prototipo que marca elementos en la foto de un almacén: Isaac 0.1 encaja en cualquier lugar donde la tarea sea mirar una imagen y responder una pregunta específica. Ejecútalo en Picasso IA sin escribir una sola línea de código.

Oficial

Perceptron Ai Inc

28.2k ejecuciones

Isaac 0.1

2025-11-13

Uso comercial

Detecta objetos en fotos con Isaac 0.1 gratis

Tabla de contenidos

  • Descripción general
  • Cómo funciona
  • Preguntas frecuentes
  • Costo de Créditos
  • Características
  • Casos de uso
Obtén Nano Banana Pro

Descripción general

Isaac 0.1 es un modelo de visión de código abierto de 2 mil millones de parámetros que analiza imágenes y devuelve respuestas espaciales estructuradas a preguntas en lenguaje natural. Mientras que la mayoría de las herramientas de IA para imágenes generan nuevos visuales, Isaac 0.1 lee lo que ya está en una foto: puede dibujar cajas delimitadoras alrededor de objetos detectados, señalar coordenadas exactas, trazar contornos poligonales o escribir una descripción en texto sin formato de lo que encuentra. En Picasso IA, subes cualquier imagen, haces una pregunta en lenguaje sencillo y recibes datos de localización precisos en segundos. Sin configuración, sin código, sin archivos de configuración.

Cómo funciona

  • Sube la imagen que quieras analizar usando el campo de entrada de imagen.
  • Escribe una pregunta o instrucción en lenguaje natural en el campo del prompt, como "encuentra la señal de alto" o "identifica a los peatones en la escena."
  • Elige el tipo de respuesta: "box" devuelve coordenadas de cajas delimitadoras alrededor de los objetos detectados, "point" da la coordenada central de cada elemento, "polygon" traza el contorno del objeto y "text" proporciona una descripción escrita.
  • Establece el número máximo de tokens si quieres limitar la longitud de las respuestas basadas en texto.
  • Pulsa generar y recibe una salida estructurada, lista para leer, copiar o usar en cualquier tarea posterior.

Preguntas frecuentes

¿Necesito habilidades de programación o conocimientos técnicos para usar esto? No, solo abre Isaac 0.1 en Picasso IA, ajusta la configuración que quieras y pulsa generar.

¿Es gratis probarlo? Sí, puedes ejecutar Isaac 0.1 sin una suscripción de pago para empezar. Consulta los detalles del plan actual para conocer los límites de generación y el uso de créditos.

¿Cuánto tarda en obtenerse los resultados? La mayoría de las solicitudes se completan en unos pocos segundos. El tiempo de procesamiento depende del tamaño de la imagen y del tipo de salida espacial que hayas seleccionado.

¿Qué formatos de salida son compatibles? Isaac 0.1 devuelve coordenadas de cajas delimitadoras, ubicaciones de puntos, límites de polígonos o descripciones en texto sin formato. Tú eliges el formato usando el selector de tipo de respuesta antes de ejecutar el modelo.

¿Puedo usar las salidas en mis propios proyectos? Sí. Los datos estructurados que devuelve Isaac 0.1, como coordenadas de cajas delimitadoras o contornos poligonales, pueden copiarse y usarse en cualquier aplicación, hoja de cálculo o flujo de trabajo que estés construyendo.

¿Qué tipos de imágenes funcionan mejor? El modelo funciona bien con fotografías claras y bien iluminadas con sujetos definidos. Las imágenes borrosas, muy recortadas o de resolución muy baja pueden reducir la precisión de las salidas espaciales.

¿Qué pasa si no estoy satisfecho con el resultado? Prueba a reformular tu prompt para ser más específico sobre lo que quieres localizar o describir. Cambiar el tipo de respuesta, por ejemplo de "box" a "polygon", también puede producir una salida más útil para ciertos tipos de objetos.

Costo de Créditos

Cada generación consume 1 crédito

1 crédito

o 5 créditos para 5 generaciones

Características

Todo lo que este modelo puede hacer por ti

Cuatro modos de salida

Devuelve resultados como cajas delimitadoras, formas poligonales, coordenadas de puntos o texto sin formato según tu selección.

Arquitectura de 2B parámetros

Incorpora un modelo completo de 2 mil millones de parámetros en un tamaño adecuado para una inferencia rápida sobre imágenes reales.

Prompting flexible

Acepta cualquier pregunta en lenguaje natural sobre la imagen, no limitada a categorías predefinidas.

Localización precisa

Los modos de cajas delimitadoras y polígonos devuelven regiones exactas de píxeles alrededor de cada objeto detectado.

No requiere código

Ejecuta el modelo directamente en tu navegador en Picasso IA sin configuración ni llamadas a la API.

Longitud de salida configurable

Ajusta el número máximo de tokens para obtener una respuesta breve o una descripción más larga en una sola ejecución.

Base de código abierto

Construido sobre un modelo abierto de 2B parámetros, auditable y reproducible sin restricciones propietarias.

Casos de uso

Sube una foto de una calle y pregunta si es seguro cruzar, obteniendo una respuesta de texto en segundos

Detecta y localiza objetos en una foto de un almacén solicitando cajas delimitadoras alrededor de cada elemento

Identifica las coordenadas exactas de píxeles de una señal o botón específico en una captura de pantalla de la interfaz

Delimita formas irregulares en una imagen satelital o cenital usando el modo de respuesta de polígonos

Comprueba la ubicación de una etiqueta en la foto de un producto pidiéndole al modelo que localice la etiqueta con una caja delimitadora

Realiza una comprobación rápida de seguridad en la foto de una obra preguntando qué peligros son visibles

Procesa un documento escaneado para encontrar y localizar regiones de texto específicas sin escribir código

Cambiar Categoría

Efectos

Texto a Imagen

Texto a Imagen

Texto a Video

Modelos de Lenguaje Extensos

Modelos de Lenguaje Extensos

Texto a Voz

Texto a Voz

Super Resolución

Super Resolución

Sincronización Labial

Generación de Música con IA

Generación de Música con IA

Edición de Video

Voz a Texto

Voz a Texto

Mejorar Videos con IA

Eliminar Fondos

Eliminar Fondos