• شعار Picasso IA
    Logo Picasso IA
  • الرئيسية
  • صورة ذكاء اصطناعي
    Nano Banana 2
  • فيديو ذكاء اصطناعي
    Veo 3.1 Lite
  • دردشة ذكاء اصطناعي
    Gemini 3 Pro
  • تحرير الصور
  • تحسين الصورة
  • إزالة الخلفية
  • تحويل النص إلى كلام
  • التأثيرات
    NEW
  • التوليدات
  • الفواتير
  • الدعم
  • الحساب
  1. مجموعة
  2. تحويل الكلام إلى نص
  3. Granite Speech 4.1 2b

Granite Speech 4.1 2B: تحويل الكلام إلى نص بـ 6 لغات

Granite Speech 4.1 2B هو نموذج مدمج للتعرّف على الكلام مصمم للأشخاص الذين يحتاجون إلى نسخ دقيق عبر لغات متعددة دون بنية تحتية معقدة. سواء كنت بودكاسترًا يعمل مع ضيوف دوليين، أو باحثًا يتعامل مع مقابلات متعددة اللغات، أو مطورًا يبني تطبيقًا مدعومًا بالصوت، فإنه يحول الكلام المنطوق مباشرة إلى نص يمكنك استخدامه فورًا. يتعامل النموذج مع التعرّف التلقائي على الكلام في ست لغات: الإنجليزية، الفرنسية، الألمانية، الإسبانية، البرتغالية، واليابانية. وإلى جانب النسخ، يدعم الترجمة الصوتية ثنائية الاتجاه، حيث يحول المحتوى المنطوق من لغة إلى نص مكتوب بلغة أخرى في خطوة واحدة. وبعدد 2 مليار معلمة فقط، يعمل بكفاءة ويعيد النتائج دون التأخيرات المعتادة في نماذج الكلام الأكبر. يمكنك تزويده بمقطع قصير واحد أو تسجيل أطول، وسيعيد نصًا نظيفًا جاهزًا للصق في المستندات أو ملفات الترجمة أو قواعد البيانات. وهو يناسب بشكل طبيعي سير عمل إنتاج المحتوى، وخطوط خدمة العملاء متعددة اللغات، ومشاريع النسخ. قدّم له عينة صوتية الآن واحصل على النص خلال ثوانٍ.

رسمي

Ibm Granite

9 تشغيل

Granite Speech 4.1 2b

2026-04-27

الاستخدام التجاري

Granite Speech 4.1 2B: تحويل الكلام إلى نص بـ 6 لغات

جدول المحتويات

  • نظرة عامة
  • كيف يعمل
  • الأسئلة الشائعة
  • تكلفة الأرصدة
  • الميزات
  • حالات الاستخدام
احصل على Nano Banana Pro

نظرة عامة

Granite Speech 4.1 2B يحول الصوت المنطوق إلى نص مكتوب دقيق عبر ست لغات، ليحل مشكلة توقف الكثير من المبدعين والمحترفين: الحصول على نص موثوق دون قضاء ساعات في العمل اليدوي. سواء كنت صحفيًا يعمل على مقابلات مسجلة، أو منشئ محتوى يستخرج اقتباسات من حلقة بودكاست، أو محللًا يراجع تسجيلات الاجتماعات، فإن هذا النموذج يتولى التحويل بسرعة. ترفع صوتك على Picasso IA وتتلقى نصًا نظيفًا وسهل القراءة خلال ثوانٍ، أو ترجمة إذا كنت تحتاج المحتوى بلغة مختلفة. وهو يدعم الإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية واليابانية، مع ترجمة ثنائية الاتجاه مدمجة بين هذه اللغات.

كيف يعمل

  • ارفع ملفك الصوتي بإحدى اللغات الست المدعومة، أو مرر تسجيلًا من جهازك
  • اكتب اختياريًا prompt قصيرًا أو تعليمات للنظام لتشكيل المخرجات، مثل طلب تنسيق معين أو طلب ترجمة إلى لغة مستهدفة
  • اضبط إعدادات مثل temperature أو حدود tokens إذا كنت تريد تحكمًا أدق في طول المخرجات واتساقها
  • اضغط generate واستلم نصًا عاديًا خلال ثوانٍ، يتناسب مع طول التسجيل
  • انسخ النتيجة من لوحة المخرجات والصقها في مستندك أو ملف الترجمة أو التقرير أو أي أداة أخرى في سير عملك

الأسئلة الشائعة

هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Granite Speech 4.1 2B على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط generate.

هل هو مجاني للتجربة؟ نعم، يمكنك تشغيل Granite Speech 4.1 2B دون أي التزام مسبق. راجع صفحة حسابك لمعرفة تفاصيل الرصيد أو الخطة الحالية.

ما اللغات التي يدعمها النموذج؟ يغطي النموذج الإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية واليابانية. ويمكنه نسخ الكلام داخل أي من هذه اللغات وترجمة المحتوى الصوتي بينها في كلا الاتجاهين.

كم يستغرق الحصول على نص؟ تُعاد معظم المقاطع الصوتية بنتيجة خلال بضع ثوانٍ. وتستغرق التسجيلات الأطول وقتًا إضافيًا قليلًا حسب طول الملف ووضوح الصوت.

ماذا يُرجع النموذج؟ يعيد النموذج نصًا عاديًا. يمكنك نسخه مباشرة من لوحة النتائج ووضعه في أي مستند أو بريد إلكتروني أو محرر ترجمة أو أداة نشر.

هل يمكنني أن أطلب من النموذج الترجمة بدلًا من النسخ فقط؟ نعم. استخدم حقول prompt أو system prompt لتحديد اللغة المستهدفة. على سبيل المثال، كتابة "ترجم هذا الصوت إلى الإنجليزية" ستعيد المحتوى بتلك اللغة بدلًا من الأصلية.

ماذا لو احتوى النص المنسوخ على أخطاء؟ حاول خفض إعداد temperature للحصول على مخرجات أكثر اتساقًا، وتأكد من أن التسجيل واضح قدر الإمكان. كما يمكن أن يساعد تقديم prompt سياقي قصير حول الموضوع أو المتحدث النموذج على إنتاج نتائج أدق.

تكلفة الأرصدة

كل توليد يستهلك 1 رصيد

1 رصيد

أو 5 أرصدة لـ 5 توليدات

الميزات

كل ما يمكن لهذا النموذج فعله من أجلك

التعرّف على الكلام متعدد اللغات

يتعرّف على الكلام بالإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية واليابانية مباشرة.

الترجمة ثنائية الاتجاه

يحول الصوت المنطوق بلغة واحدة إلى نص مكتوب بلغة أخرى دون خطوة منفصلة.

نموذج مدمج 2B

يعيد نسخًا دقيقة أسرع من النماذج الأكبر بفضل عدد معلماته الأقل.

البث في الوقت الفعلي

يخرج النص أثناء إنشائه، بحيث تحصل على نتائج جزئية قبل انتهاء معالجة الصوت بالكامل.

إمكانية إعادة الإنتاج عبر البذرة

عيّن قيمة seed لإعادة إنتاج مخرجات نسخ متطابقة عبر عدة تشغيلات.

عناصر تحكم في العينة

اضبط temperature وtop-k وtop-p لضبط دقة المخرجات وفقًا للصوت الخاص بك.

أوضاع إدخال مرنة

يقبل الصوت إلى جانب رسائل بأسلوب الدردشة أو مطالبات الإكمال القياسية لأساليب تكامل مختلفة.

حالات الاستخدام

نسخ حلقة بودكاست أو مقابلة مسجلة إلى نص مكتوب يمكنك تحريره ونشره

تحويل مذكرة صوتية مسجلة بالإسبانية أو الفرنسية إلى مستند نصي بالإنجليزية في خطوة واحدة

إنشاء نص من تسجيل صوتي ياباني للأرشفة أو الترجمة أو المراجعة

نسخ مكالمات خدمة العملاء بعدة لغات لتحليل الجودة والامتثال

استخراج المحتوى المنطوق من تسجيل اجتماع ولصقه مباشرة في الملاحظات أو ملخص

بناء ميزة إدخال صوتي في تطبيق من خلال ربط بيانات الصوت بمخرجات النسخ الخاصة بالنموذج

إنشاء ترجمات لفيديو متعدد اللغات عبر تزويد المسار الصوتي واستلام النص مرة أخرى

تبديل الفئة

تأثيرات

تحويل النص إلى صورة

تحويل النص إلى صورة

تحويل النص إلى فيديو

نماذج اللغة الكبيرة

نماذج اللغة الكبيرة

تحويل النص إلى كلام

تحويل النص إلى كلام

دقة فائقة

دقة فائقة

مزامنة الشفاه

توليد الموسيقى بالذكاء الاصطناعي

توليد الموسيقى بالذكاء الاصطناعي

تحرير الفيديو

تحويل الكلام إلى نص

تحويل الكلام إلى نص

تحسين الفيديو بالذكاء الاصطناعي

تحسين الفيديو بالذكاء الاصطناعي

إزالة الخلفية

إزالة الخلفية