• شعار Picasso IA
    Logo Picasso IA
  • الرئيسية
  • صورة ذكاء اصطناعي
    Nano Banana 2
  • فيديو ذكاء اصطناعي
    Veo 3.1 Lite
  • دردشة ذكاء اصطناعي
    Gemini 3 Pro
  • تحرير الصور
  • تحسين الصورة
  • إزالة الخلفية
  • تحويل النص إلى كلام
  • التأثيرات
  • AI Toolkit
    NEW
  • التوليدات
  • الفواتير
  • الدعم
  • الحساب
فيديوهات غير محدودة متاحة الآن · Nano Banana 2 و GPT Image 2.0 غير محدودين حتى ٢٥ يونيوترقية
  1. مجموعة
  2. نماذج اللغة الكبيرة (LLMs)
  3. Granite Vision 4.1 4b

Granite Vision 4.1 4B: مستخرج جداول ورسوم بيانية بالذكاء الاصطناعي

Granite Vision 4.1 4B هو نموذج رؤية-لغة مدمج بُني خصيصًا لاستخراج البيانات المنظمة من المستندات. إذا سبق لك أن اضطررت إلى نسخ البيانات يدويًا من تقرير ممسوح ضوئيًا، أو مخطط في ملف PDF، أو جدول في شريحة عرض، فإن هذا النموذج يقوم بهذا العمل نيابةً عنك. يقرأ صورة المستند ويعيد المعلومات كنص نظيف ومنظم. يتعامل النموذج مع ثلاث مهام استخراج مميزة: قراءة الرسوم البيانية، وتحليل الجداول، واكتشاف أزواج الوسم-القيمة. ارفع تقريرًا ماليًا فيستخرج البيانات الجدولية صفًا بعد صف. اعرض عليه مخطط أعمدة فيعيد الأرقام الأساسية. وجّهه إلى فاتورة فيلتقط أسماء الحقول إلى جانب قيمها، جاهزة للنسخ مباشرة إلى جدول بيانات. يناسب هذا بشكل طبيعي سير العمل الذي تصل فيه المستندات كصور أو ملفات ممسوحة ضوئيًا. يمكن للباحثين والمحللين ومشغلي المحتوى تجاوز الإدخال اليدوي والحصول على مخرجات منظمة في ثوانٍ. شغّله على Picasso IA لترى كيف يتعامل مع مستنداتك دون أي إعداد.

رسمي

Ibm Granite

9.7k تشغيل

Granite Vision 4.1 4b

2026-05-15

الاستخدام التجاري

Granite Vision 4.1 4B: مستخرج جداول ورسوم بيانية بالذكاء الاصطناعي

جدول المحتويات

  • نظرة عامة
  • كيف يعمل
  • الأسئلة المتكررة
  • تكلفة الأرصدة
  • الميزات
  • حالات الاستخدام
احصل على Nano Banana Pro

نظرة عامة

Granite Vision 4.1 4B هو نموذج رؤية-لغة بُني لاستخراج البيانات المنظمة من المستندات المعقدة دون أي نسخ يدوي أو إعادة تنسيق. إذا كنت قد أمضيت وقتًا في إعادة كتابة الجداول من ملفات PDF، أو التحديق في محاور الرسوم البيانية لقراءة الأرقام، أو تجميع أزواج المفتاح-القيمة من الفواتير الممسوحة، فإن هذا النموذج يتولى هذا العمل في ثوانٍ. على Picasso IA، تتم العملية في ثلاث خطوات: حمّل صورة المستند، صف ما تحتاج إليه، واقرأ النتيجة. وبحجم 4 مليارات معلمة، فهو مدمج بما يكفي لإرجاع الإجابات بسرعة مع الحفاظ على دقته في أنواع المستندات التي صُمم خصيصًا لها، بما في ذلك الرسوم البيانية والجداول والنماذج المنظمة.

كيف يعمل

  • حمّل صورة مستند واحدة أو أكثر، مثل لقطة شاشة لصفحة PDF، أو صورة لجدول مطبوع، أو رسم بياني مُصدّر من مجموعة شرائح
  • اكتب مطالبة تصف البيانات التي تريدها، على سبيل المثال "استخرج جميع الصفوف من جدول الإيرادات" أو "أعد المفتاح والقيمة من كل حقل في هذه الفاتورة"
  • اختياريًا، اكتب مطالبة نظام لتحديد تنسيق المخرجات، مثل JSON أو قيم مفصولة بفواصل أو نص عادي موسوم
  • يقرأ النموذج الصورة ويعيد استجابة نصية منظمة حول ما طلبته
  • انسخ النتيجة والصقها مباشرة في جدول البيانات أو قاعدة البيانات أو التقرير

الأسئلة المتكررة

هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Granite Vision 4.1 4B على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط على توليد.

هل يمكن تجربته مجانًا؟ نعم، يمكنك تشغيل النموذج على Picasso IA دون اشتراك مدفوع لاختباره أولًا على مستنداتك الخاصة.

كم يستغرق الحصول على النتائج؟ تكتمل معظم عمليات الاستخراج في بضع ثوانٍ. تم اختيار حجم 4 مليارات معلمة جزئيًا من أجل السرعة، لذا لن تنتظر طويلًا حتى على المستندات التفصيلية.

ما أنواع المستندات التي يتعامل معها جيدًا؟ يؤدي بشكل موثوق على جداول البيانات المطبوعة، والمخططات المالية، والفواتير، والنماذج المنظمة، وأي صورة تكون فيها المعلومات مرتبة بتخطيط متسق. قد تقلل عمليات المسح المتدهورة بشدة أو الصفحات المكتوبة بخط اليد بكثافة من الدقة.

هل يمكنني التحكم في تنسيق المخرجات؟ نعم. حدّد التنسيق في مطالبة النظام أو في المطالبة نفسها. اطلب JSON أو صفوفًا مرقمة أو نصًا عاديًا موسومًا أو أي بنية أخرى وسيلتزم النموذج بهذه التعليمات باستمرار.

كم مرة يمكنني تشغيل النموذج؟ يمكنك إجراء ما تشاء من عمليات الاستخراج. تُعالج كل طلبية بشكل مستقل، لذا يمكنك تجربة مطالبات مختلفة على المستند نفسه حتى تطابق المخرجات ما تبحث عنه.

أين يمكنني استخدام ما يعيده النموذج؟ المخرجات النصية بسيطة وجاهزة للنسخ إلى أي أداة، من جدول بيانات إلى تطبيق لإدارة المشاريع. لا توجد علامات مائية أو قيود على التنسيق فيما ينشئه النموذج.

تكلفة الأرصدة

كل توليد يستهلك 1 رصيد

1 رصيد

أو 5 أرصدة لـ 5 توليدات

الميزات

كل ما يمكن لهذا النموذج فعله من أجلك

بصمة مدمجة بحجم 4B

يعمل بسرعة من دون متطلبات العتاد الخاصة بنماذج VLM كاملة النطاق، مما يجعله عمليًا لأعمال المستندات اليومية.

استخراج الرسوم البيانية

يقرأ مخططات الأعمدة والدوائر والخطوط ويعيد البيانات الأساسية كنص عادي.

تحليل الجداول

يحول الجداول في المستندات أو الصور الممسوحة إلى مخرجات منظمة وواضحة على هيئة صفوف وأعمدة.

اكتشاف أزواج الوسم-القيمة

يحدد أسماء الحقول وقيمها المرتبطة بها في النماذج والفواتير والتقارير.

مدخلات رؤية-لغة

يقبل كلًا من صورة ومطالبة نصية، بحيث يمكنك طرح أسئلة محددة حول مستند.

استجابات متدفقة

يعيد المخرجات أثناء توليدها، بحيث ترى النتائج تصل تدريجيًا بدلًا من انتظار الرد الكامل.

طول إخراج قابل للتعديل

اضبط حدًا للرموز للحصول على ملخصات موجزة أو عمليات استخراج تفصيلية كاملة حسب حاجتك.

نتائج قابلة لإعادة الإنتاج

اضبط قيمة seed للحصول على المخرجات نفسها عند إعادة تشغيل مستند عبر النموذج.

حالات الاستخدام

حمّل صورة لجدول مطبوع واحصل على البيانات في صفوف مفصولة بفواصل، جاهزة للنسخ إلى جدول بيانات

أرسل صورة مخطط واطلب من النموذج إرجاع القيم الرقمية خلف الأعمدة أو الخطوط أو المقاطع

عالج صورة فاتورة ممسوحة ضوئيًا لاستخراج تسميات الحقول والمبالغ المقابلة لها تلقائيًا

حمّل صفحة من ورقة بحثية تحتوي على شكل واستخرج قيم البيانات من الرسوم البيانية المضمنة في الصورة

حوّل لقطة شاشة لجدول تسعير إلى نص منظم دون إعادة كتابة أي بيانات يدويًا

أرسل صفحة مستند تمزج بين النص والجداول، ثم استخرج الأقسام الجدولية فقط كمخرجات منظمة ونظيفة

استخرج الحقول الموسومة من صورة نموذج، مثل مستند ضريبي أو ورقة تسجيل، لتسريع إدخال البيانات

تبديل الفئة

تأثيرات

تحويل النص إلى صورة

تحويل النص إلى فيديو

نماذج اللغة الكبيرة

تحويل النص إلى كلام

دقة فائقة

مزامنة الشفاه

توليد الموسيقى بالذكاء الاصطناعي

تحرير الفيديو

تحويل الكلام إلى نص

تحسين الفيديو بالذكاء الاصطناعي

إزالة الخلفية