• شعار Picasso IA
    Logo Picasso IA
  • الرئيسية
  • صورة ذكاء اصطناعي
    Nano Banana 2
  • فيديو ذكاء اصطناعي
    Veo 3.1 Fast
  • دردشة ذكاء اصطناعي
    Gemini 3 Pro
  • تحرير الصور
  • تحسين الصورة
  • إزالة الخلفية
  • تحويل النص إلى كلام
  • التأثيرات
    NEW
  • التوليدات
  • الفواتير
  • الدعم
  • الحساب
  1. مجموعة
  2. نماذج اللغة الكبيرة (LLMs)
  3. Granite Vision 3.3 2b

قراءة المخططات والجداول باستخدام Granite Vision 3.3 2B

Granite Vision 3.3 2B هو نموذج رؤية-لغة مدمج صُمم لمهمة واحدة محددة: قراءة المستندات المرئية وفهمها. إذا كان سير عملك يتضمن استخراج البيانات من المخططات أو الجداول أو الإنفوغرافيك أو المخططات التقنية، فإن هذا النموذج يتولى الاستخراج نيابةً عنك من دون نسخ يدوي أو تفريغ نصي. قدّم له صورة لجدول مالي واطلب قيم صفوف محددة. وجّهه إلى مخطط علمي واطلب وصفًا بلغة بسيطة لكل قسم. أضف لقطة شاشة لإنفوغرافيك كثيف واسأل عن الأرقام الرئيسية. يقرأ النموذج البنية المرئية، ويفسر البيانات، ويعيد استجابة نصية مركزة لسؤالك. وهو يناسب بشكل طبيعي سير العمل الذي يعتمد على المستندات، حيث تكون القراءة اليدوية بطيئة وعرضةً للأخطاء. ارفع لقطة شاشة، واكتب سؤالك، واحصل على الإجابة خلال ثوانٍ. إذا لم تكن الاستجابة الأولى صحيحة، فاضبط درجة الحرارة أو حسّن صياغة طلبك وأعد تشغيله. لا حاجة إلى أي إعداد يتجاوز اختيار صورتك.

رسمي

Ibm Granite

197.6k تشغيل

Granite Vision 3.3 2b

2025-07-14

الاستخدام التجاري

قراءة المخططات والجداول باستخدام Granite Vision 3.3 2B

جدول المحتويات

  • نظرة عامة
  • كيف يعمل
  • الأسئلة الشائعة
  • تكلفة الأرصدة
  • الميزات
  • حالات الاستخدام
احصل على Nano Banana Pro

نظرة عامة

Granite Vision 3.3 2B هو نموذج رؤية-لغة مدمج بُني لقراءة المعلومات المنظمة واستخراجها من المستندات المرئية، ليحل مشكلة لا تستطيع أدوات النصوص التقليدية حلها: فهم الجداول والمخططات والإنفوغرافيك والرسوم البيانية والمخططات التوضيحية وتحويلها إلى بيانات قابلة للاستخدام. تخيّل محللًا ماليًا يستخرج أرقام الربع السنوية من تقرير ممسوح ضوئيًا، أو باحثًا ينقل مخططًا لمنهجية دون إعادة كتابة أي خلية يدويًا. على Picasso IA، ترفع صورة وتكتب سؤالًا بلغة بسيطة، ويعيد النموذج إجابة مركزة ومقروءة خلال ثوانٍ. وبـ 2 مليار معامل، يبقى سريعًا من دون التضحية بالدقة التي يتطلبها عمل استخراج المستندات.

كيف يعمل

  • ارفع صورة واحدة أو أكثر من صور المستندات: صفحات ممسوحة ضوئيًا، أو لقطات شاشة للمخططات، أو شرائح عروض تقديمية، أو تصديرات للمخططات التوضيحية
  • اكتب طلبًا يصف بدقة ما تحتاجه، مثل "لخّص البيانات في هذا المخطط الشريطي" أو "استخرج كل قيم الصفوف من الجدول في هذه الصفحة"
  • أضف اختياريًا موجه نظام للتحكم في بنية الاستجابة، مثل طلب إخراج JSON، أو قائمة مرقمة، أو جدول markdown
  • اضبط درجة الحرارة والحد الأقصى للرموز إذا كنت تحتاج إلى إجابات واقعية أكثر دقة أو ردود منسقة أطول
  • أرسل الطلب واستلم المحتوى المستخرج أو الإجابة المنظمة في لوحة الإخراج خلال ثوانٍ

الأسئلة الشائعة

هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، ما عليك سوى فتح Granite Vision 3.3 2B على Picasso IA، وضبط الإعدادات التي تريدها، ثم الضغط على توليد.

هل التجربة مجانية؟ نعم، يمكنك تشغيل Granite Vision 3.3 2B من دون أي تكلفة مسبقة. راجع قسم التسعير على Picasso IA لمعرفة تفاصيل كيفية عمل أرصدة التوليد.

كم من الوقت يستغرق الحصول على النتائج؟ تُعاد معظم الطلبات خلال بضع ثوانٍ. يعتمد وقت المعالجة على تعقيد الصورة وطول الإخراج الذي طلبته، لكن حجم المعاملات 2B يحافظ على السرعة مقارنةً بنماذج الرؤية الأكبر.

ما أنواع الصور التي يتعامل معها بشكل أفضل؟ يؤدي أداءً جيدًا مع الجداول، ومخططات الأعمدة، والمخططات الدائرية، والإنفوغرافيك، والمخططات التقنية، والمخططات المبعثرة، والشرائح الغنية بالنصوص. وهو يعمل مع الصور الرقمية النظيفة ومع عمليات المسح المضغوطة بدرجة متوسطة.

ما صيغ الإخراج التي يمكنني الحصول عليها؟ يعيد النموذج نصًا عاديًا افتراضيًا. يمكنك تشكيل الصيغة عبر طلبك: اطلب جدول markdown، أو كائن JSON، أو قائمة مرقمة، أو فقرة قصيرة، وسيطابق البنية التي تصفها.

هل يمكنني إرسال عدة صور في طلب واحد؟ نعم. يقبل النموذج مصفوفة من مدخلات الصور، لذا يمكنك إدخال عدة صفحات مستندات دفعةً واحدة وطرح أسئلة تمتد عبرها في توليد واحد.

ماذا لو فات الإخراج تفصيلًا أو أخطأ في شيء؟ حاول إعادة صياغة طلبك ليكون أكثر تحديدًا بشأن ما تريد استخراجه. عادةً ما يؤدي خفض إعداد درجة الحرارة نحو 0 إلى إجابات أكثر دقة وتركيزًا على الحقائق عند العمل مع البيانات المنظمة.

تكلفة الأرصدة

كل توليد يستهلك 1 رصيد

1 رصيد

أو 5 أرصدة لـ 5 توليدات

الميزات

كل ما يمكن لهذا النموذج فعله من أجلك

قراءة المستندات المرئية

تستخرج النصوص والبيانات والسياق من المخططات والجداول والإنفوغرافيك في طلب واحد.

إدخال متعدد الصور

أرسل عدة صور دفعةً واحدة لمعالجة المستندات متعددة الصفحات أو لمقارنة المصادر المرئية.

طول إخراج قابل للتعديل

اضبط الحد الأدنى والأقصى لعدد الرموز للحصول على ملخصات موجزة أو تفصيلات أكثر عمقًا.

التحكم في درجة الحرارة

خفّض درجة الحرارة لاستخراج دقيق وموضوعي، وارفعها للحصول على إجابات أكثر وصفية.

موجه نظام مخصص

عيّن دورًا أو سياقًا قبل كل جلسة للحفاظ على اتساق الردود عبر سير عملك.

Top-k وأخذ العينات النواتي

اضبط بدقة كيفية اختيار النموذج للرموز للحصول على مخرجات أكثر تنوعًا أو أكثر تركيزًا.

التحكم في تسلسل الإيقاف

عرّف رموز إيقاف مخصصة لإنهاء التوليد تمامًا عند النقطة التي تحتاجها.

حالات الاستخدام

استخرج القيم من جدول بيانات في مستند ممسوح ضوئيًا عبر رفع الصورة وطلب من النموذج سرد كل صف

اسأل عن الاتجاه الذي يوضحه مخطط أعمدة أو رسم بياني خطي واحصل على ملخص مكتوب بلغة بسيطة

صف محتوى إنفوغرافيك لتحويل المعلومات المرئية إلى نص قابل للبحث والنسخ

اقرأ التسميات والعلاقات في مخطط تقني من خلال مطالبة النموذج بشرح كل مكوّن

استخرج أرقامًا محددة من لقطة شاشة لمخطط مالي من دون قراءة كل علامة تدريج يدويًا

أنشئ وصفًا مكتوبًا لمخطط علمي عبر رفع الصورة وطلب النتائج الرئيسية

حوّل جدولًا أو نموذجًا مكتوبًا بخط اليد إلى نص عبر رفع صورة وطلب من النموذج سرد محتويات الخلايا

تبديل الفئة

تأثيرات

تحويل النص إلى صورة

تحويل النص إلى صورة

تحويل النص إلى فيديو

نماذج اللغة الكبيرة

نماذج اللغة الكبيرة

تحويل النص إلى كلام

تحويل النص إلى كلام

دقة فائقة

دقة فائقة

مزامنة الشفاه

توليد الموسيقى بالذكاء الاصطناعي

توليد الموسيقى بالذكاء الاصطناعي

تحرير الفيديو

تحويل الكلام إلى نص

تحويل الكلام إلى نص

تحسين الفيديو بالذكاء الاصطناعي

إزالة الخلفية

إزالة الخلفية