تحويل الصوت إلى نص باستخدام Granite Speech 3.3 8B

Granite Speech 3.3 8B هو نموذج صوتي مدمج صُمم لمهمتين دقيقتين: تحويل الصوت المنطوق إلى نص مكتوب وترجمة الكلام من لغة إلى نص مكتوب بلغة أخرى. إذا كنت تعمل مع مقابلات مسجلة أو بودكاست أو محاضرات أو صوت متعدد اللغات، فإن الحصول على نصوص نظيفة يدويًا يستغرق ساعات. هذا النموذج يختصر ذلك إلى ثوانٍ. ينتج النموذج نصوصًا مقروءة ودقيقة عبر مجموعة من ظروف الصوت دون أي معالجة مسبقة خاصة منك. وهو يدعم كلًا من التعرف التلقائي على الكلام وترجمة الكلام في سير عمل واحد، لذا لا تحتاج إلى أدوات منفصلة لكل خطوة. تتيح لك عناصر التحكم في أخذ العينات مثل temperature وtop-k وtop-p ضبط كيفية ظهور المخرجات عندما تكون الدقة مهمة. يمكنك إسقاط المخرجات مباشرة في خط محتوى أو نظام تدوين ملاحظات أو أداة تقارير كنص عادي جاهز للتعديل أو التخزين. يناسب Granite Speech 3.3 8B على Picasso IA أي مكان يبطئ فيه الصوت سير عملك، ولا يستغرق الأمر سوى أقل من دقيقة للحصول على أول نص.

رسمي

Ibm Granite

19.3k تشغيل

Granite Speech 3.3 8b

2025-07-15

الاستخدام التجاري

تحويل الصوت إلى نص باستخدام Granite Speech 3.3 8B

نظرة عامة

Granite Speech 3.3 8B هو نموذج مدمج للتعرف على الكلام يحول الصوت المنطوق إلى نص دقيق وقابل للقراءة دون أي برمجة أو إعداد تقني. وهو يتعامل مع كل من مهام النسخ والترجمة، مما يجعله مفيدًا لمجموعة واسعة من المحتوى الصوتي. على Picasso IA، تقوم بتحميل الصوت الخاص بك، وتعديل بعض الإعدادات الاختيارية، والحصول على مخرجات نصية نظيفة في ثوانٍ. سواء كنت تنسخ مكالمة عميل، أو تضيف ترجمات لفيديو، أو تستخرج ملاحظات من اجتماع مسجل، فإن النموذج يقوم بعمل التحويل نيابةً عنك.

كيف يعمل

حمّل ملفًا صوتيًا واحدًا أو أكثر من جهازك، مثل مقابلة مسجلة أو حلقة بودكاست أو مذكرة صوتية.
أضف prompt اختياريًا أو prompt للنظام لمنح النموذج سياقًا، مثل أدوار المتحدثين أو موضوع التركيز أو تنسيق الإخراج المفضل.
اضبط حد الرموز وtemperature إذا كنت تريد التحكم في مقدار النص الذي يتم إنشاؤه ومدى اتباع المخرجات للصوت.
يعالج النموذج الكلام، ويحدد الكلمات والعبارات، ويعيد نصًا مكتوبًا لما قيل.
راجع المخرجات في لوحة النتائج، ثم انسخها مباشرة إلى مستندك أو ملف الترجمة أو أداة سير العمل.

الأسئلة الشائعة

هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Granite Speech 3.3 8B على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط على توليد.

هل هو مجاني للتجربة؟ نعم، يمكنك تشغيل Granite Speech 3.3 8B دون إدخال تفاصيل الدفع للبدء. يعتمد استخدام الرصيد على الخطة التي أنت عليها.

كم من الوقت يستغرق الحصول على النتائج؟ تُرجع معظم المقاطع الصوتية القصيرة نصًا في بضع ثوانٍ. تستغرق التسجيلات الأطول وقتًا أكثر قليلًا، لكن تصميم المعلمات 8B يحافظ على سرعة المعالجة.

ما صيغ الإخراج المدعومة؟ يعيد النموذج نصًا عاديًا. يمكنك نسخ النص المنسوخ ولصقه في أي محرر مستندات أو أداة ترجمة نصية أو تطبيق لتدوين الملاحظات تستخدمه بالفعل.

هل يمكنني تخصيص نمط الإخراج؟ نعم. يتيح لك prompt للنظام أو prompt للمستخدم تحديد النبرة أو التنسيق أو التركيز. تمنحك إعدادات temperature والرموز تحكمًا إضافيًا في كيفية قراءة النص.

ما اللغات التي يدعمها؟ تم بناء النموذج للتعرف التلقائي على الكلام والترجمة عبر مجموعة من اللغات المنطوقة. للحصول على أفضل النتائج، استخدم صوتًا واضحًا مع الحد الأدنى من الضوضاء الخلفية.

ماذا يحدث إذا لم أكن راضيًا عن النتيجة؟ اضبط prompt الخاص بك أو غيّر إعداد temperature وشغّل النموذج مرة أخرى. نظرًا لأن كل عملية توليد سريعة، فعادةً ما يستغرق الأمر محاولتين فقط للحصول على نص منسوخ قابل للاستخدام.

تكلفة الأرصدة

كل توليد يستهلك 1 رصيد

1 رصيد

أو 5 أرصدة لـ 5 توليدات

الميزات

كل ما يمكن لهذا النموذج فعله من أجلك

نسخ دقيق

يحول الكلمات المنطوقة إلى نص نظيف وقابل للقراءة بدقة عالية عبر اللهجات وظروف التسجيل المختلفة.

ترجمة الكلام

يعالج الصوت بلغة واحدة ويخرج نصًا مكتوبًا بلغة أخرى، مما يلغي خطوة ترجمة منفصلة.

حجم نموذج مدمج

يعمل تصميم المعلمات 8B بكفاءة دون زمن الانتقال الخاص بالنماذج الصوتية الأكبر بكثير.

إدخال صوتي مرن

يقبل عدة ملفات صوتية في تشغيل واحد، مما يتيح لك معالجة عدة تسجيلات دفعة واحدة.

عناصر تحكم في أخذ العينات

اضبط temperature وtop-k وtop-p لضبط مدى حتمية أو تنوع مخرجات النص المنسوخ.

توجيه مخصص

أضف prompt للنظام أو prompt للمستخدم لتوجيه أسلوب النسخ أو علامات الترقيم أو تنسيق الإخراج.

دعم تسلسلات الإيقاف

حدد رموزًا معينة لإيقاف التوليد مبكرًا، مما يمنحك تحكمًا أدق في طول المخرجات.

حالات الاستخدام

انسخ مقابلة مسجلة إلى مستند نصي عن طريق تحميل الملف الصوتي مباشرة

حوّل حلقات البودكاست إلى نصوص قابلة للقراءة لملاحظات الحلقة أو الترجمة النصية

ترجم الصوت المنطوق من لغة أجنبية إلى نص مكتوب بلغتك المستهدفة

أنشئ ترجمات فيديو تدريبي عبر نسخ المحتوى المنطوق إلى ملف نصي

حوّل المذكرات الصوتية من اجتماع إلى ملخص مكتوب يمكنك مشاركته مع فريقك

انسخ مكالمات دعم العملاء إلى سجلات نصية للمراجعة الداخلية وفحوصات الجودة

حوّل تسجيلات المحاضرات إلى ملاحظات نصية يمكن للطلاب قراءتها والبحث فيها والتعليق عليها

تبديل الفئة

تأثيرات

تحويل النص إلى صورة

تحويل النص إلى فيديو

نماذج اللغة الكبيرة

تحويل النص إلى كلام

دقة فائقة

مزامنة الشفاه

توليد الموسيقى بالذكاء الاصطناعي

تحرير الفيديو

تحويل الكلام إلى نص

تحسين الفيديو بالذكاء الاصطناعي

إزالة الخلفية