Granite Speech 4.1 2B هو نموذج مدمج للتعرّف على الكلام مصمم للأشخاص الذين يحتاجون إلى نسخ دقيق عبر لغات متعددة دون بنية تحتية معقدة. سواء كنت بودكاسترًا يعمل مع ضيوف دوليين، أو باحثًا يتعامل مع مقابلات متعددة اللغات، أو مطورًا يبني تطبيقًا مدعومًا بالصوت، فإنه يحول الكلام المنطوق مباشرة إلى نص يمكنك استخدامه فورًا. يتعامل النموذج مع التعرّف التلقائي على الكلام في ست لغات: الإنجليزية، الفرنسية، الألمانية، الإسبانية، البرتغالية، واليابانية. وإلى جانب النسخ، يدعم الترجمة الصوتية ثنائية الاتجاه، حيث يحول المحتوى المنطوق من لغة إلى نص مكتوب بلغة أخرى في خطوة واحدة. وبعدد 2 مليار معلمة فقط، يعمل بكفاءة ويعيد النتائج دون التأخيرات المعتادة في نماذج الكلام الأكبر. يمكنك تزويده بمقطع قصير واحد أو تسجيل أطول، وسيعيد نصًا نظيفًا جاهزًا للصق في المستندات أو ملفات الترجمة أو قواعد البيانات. وهو يناسب بشكل طبيعي سير عمل إنتاج المحتوى، وخطوط خدمة العملاء متعددة اللغات، ومشاريع النسخ. قدّم له عينة صوتية الآن واحصل على النص خلال ثوانٍ.
Granite Speech 4.1 2B يحول الصوت المنطوق إلى نص مكتوب دقيق عبر ست لغات، ليحل مشكلة توقف الكثير من المبدعين والمحترفين: الحصول على نص موثوق دون قضاء ساعات في العمل اليدوي. سواء كنت صحفيًا يعمل على مقابلات مسجلة، أو منشئ محتوى يستخرج اقتباسات من حلقة بودكاست، أو محللًا يراجع تسجيلات الاجتماعات، فإن هذا النموذج يتولى التحويل بسرعة. ترفع صوتك على Picasso IA وتتلقى نصًا نظيفًا وسهل القراءة خلال ثوانٍ، أو ترجمة إذا كنت تحتاج المحتوى بلغة مختلفة. وهو يدعم الإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية واليابانية، مع ترجمة ثنائية الاتجاه مدمجة بين هذه اللغات.
هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Granite Speech 4.1 2B على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط generate.
هل هو مجاني للتجربة؟ نعم، يمكنك تشغيل Granite Speech 4.1 2B دون أي التزام مسبق. راجع صفحة حسابك لمعرفة تفاصيل الرصيد أو الخطة الحالية.
ما اللغات التي يدعمها النموذج؟ يغطي النموذج الإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية واليابانية. ويمكنه نسخ الكلام داخل أي من هذه اللغات وترجمة المحتوى الصوتي بينها في كلا الاتجاهين.
كم يستغرق الحصول على نص؟ تُعاد معظم المقاطع الصوتية بنتيجة خلال بضع ثوانٍ. وتستغرق التسجيلات الأطول وقتًا إضافيًا قليلًا حسب طول الملف ووضوح الصوت.
ماذا يُرجع النموذج؟ يعيد النموذج نصًا عاديًا. يمكنك نسخه مباشرة من لوحة النتائج ووضعه في أي مستند أو بريد إلكتروني أو محرر ترجمة أو أداة نشر.
هل يمكنني أن أطلب من النموذج الترجمة بدلًا من النسخ فقط؟ نعم. استخدم حقول prompt أو system prompt لتحديد اللغة المستهدفة. على سبيل المثال، كتابة "ترجم هذا الصوت إلى الإنجليزية" ستعيد المحتوى بتلك اللغة بدلًا من الأصلية.
ماذا لو احتوى النص المنسوخ على أخطاء؟ حاول خفض إعداد temperature للحصول على مخرجات أكثر اتساقًا، وتأكد من أن التسجيل واضح قدر الإمكان. كما يمكن أن يساعد تقديم prompt سياقي قصير حول الموضوع أو المتحدث النموذج على إنتاج نتائج أدق.
كل ما يمكن لهذا النموذج فعله من أجلك
يتعرّف على الكلام بالإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية واليابانية مباشرة.
يحول الصوت المنطوق بلغة واحدة إلى نص مكتوب بلغة أخرى دون خطوة منفصلة.
يعيد نسخًا دقيقة أسرع من النماذج الأكبر بفضل عدد معلماته الأقل.
يخرج النص أثناء إنشائه، بحيث تحصل على نتائج جزئية قبل انتهاء معالجة الصوت بالكامل.
عيّن قيمة seed لإعادة إنتاج مخرجات نسخ متطابقة عبر عدة تشغيلات.
اضبط temperature وtop-k وtop-p لضبط دقة المخرجات وفقًا للصوت الخاص بك.
يقبل الصوت إلى جانب رسائل بأسلوب الدردشة أو مطالبات الإكمال القياسية لأساليب تكامل مختلفة.