Granite Speech 3.3 8B هو نموذج صوتي مدمج صُمم لمهمتين دقيقتين: تحويل الصوت المنطوق إلى نص مكتوب وترجمة الكلام من لغة إلى نص مكتوب بلغة أخرى. إذا كنت تعمل مع مقابلات مسجلة أو بودكاست أو محاضرات أو صوت متعدد اللغات، فإن الحصول على نصوص نظيفة يدويًا يستغرق ساعات. هذا النموذج يختصر ذلك إلى ثوانٍ. ينتج النموذج نصوصًا مقروءة ودقيقة عبر مجموعة من ظروف الصوت دون أي معالجة مسبقة خاصة منك. وهو يدعم كلًا من التعرف التلقائي على الكلام وترجمة الكلام في سير عمل واحد، لذا لا تحتاج إلى أدوات منفصلة لكل خطوة. تتيح لك عناصر التحكم في أخذ العينات مثل temperature وtop-k وtop-p ضبط كيفية ظهور المخرجات عندما تكون الدقة مهمة. يمكنك إسقاط المخرجات مباشرة في خط محتوى أو نظام تدوين ملاحظات أو أداة تقارير كنص عادي جاهز للتعديل أو التخزين. يناسب Granite Speech 3.3 8B على Picasso IA أي مكان يبطئ فيه الصوت سير عملك، ولا يستغرق الأمر سوى أقل من دقيقة للحصول على أول نص.
Granite Speech 3.3 8B هو نموذج مدمج للتعرف على الكلام يحول الصوت المنطوق إلى نص دقيق وقابل للقراءة دون أي برمجة أو إعداد تقني. وهو يتعامل مع كل من مهام النسخ والترجمة، مما يجعله مفيدًا لمجموعة واسعة من المحتوى الصوتي. على Picasso IA، تقوم بتحميل الصوت الخاص بك، وتعديل بعض الإعدادات الاختيارية، والحصول على مخرجات نصية نظيفة في ثوانٍ. سواء كنت تنسخ مكالمة عميل، أو تضيف ترجمات لفيديو، أو تستخرج ملاحظات من اجتماع مسجل، فإن النموذج يقوم بعمل التحويل نيابةً عنك.
هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Granite Speech 3.3 8B على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط على توليد.
هل هو مجاني للتجربة؟ نعم، يمكنك تشغيل Granite Speech 3.3 8B دون إدخال تفاصيل الدفع للبدء. يعتمد استخدام الرصيد على الخطة التي أنت عليها.
كم من الوقت يستغرق الحصول على النتائج؟ تُرجع معظم المقاطع الصوتية القصيرة نصًا في بضع ثوانٍ. تستغرق التسجيلات الأطول وقتًا أكثر قليلًا، لكن تصميم المعلمات 8B يحافظ على سرعة المعالجة.
ما صيغ الإخراج المدعومة؟ يعيد النموذج نصًا عاديًا. يمكنك نسخ النص المنسوخ ولصقه في أي محرر مستندات أو أداة ترجمة نصية أو تطبيق لتدوين الملاحظات تستخدمه بالفعل.
هل يمكنني تخصيص نمط الإخراج؟ نعم. يتيح لك prompt للنظام أو prompt للمستخدم تحديد النبرة أو التنسيق أو التركيز. تمنحك إعدادات temperature والرموز تحكمًا إضافيًا في كيفية قراءة النص.
ما اللغات التي يدعمها؟ تم بناء النموذج للتعرف التلقائي على الكلام والترجمة عبر مجموعة من اللغات المنطوقة. للحصول على أفضل النتائج، استخدم صوتًا واضحًا مع الحد الأدنى من الضوضاء الخلفية.
ماذا يحدث إذا لم أكن راضيًا عن النتيجة؟ اضبط prompt الخاص بك أو غيّر إعداد temperature وشغّل النموذج مرة أخرى. نظرًا لأن كل عملية توليد سريعة، فعادةً ما يستغرق الأمر محاولتين فقط للحصول على نص منسوخ قابل للاستخدام.
كل ما يمكن لهذا النموذج فعله من أجلك
يحول الكلمات المنطوقة إلى نص نظيف وقابل للقراءة بدقة عالية عبر اللهجات وظروف التسجيل المختلفة.
يعالج الصوت بلغة واحدة ويخرج نصًا مكتوبًا بلغة أخرى، مما يلغي خطوة ترجمة منفصلة.
يعمل تصميم المعلمات 8B بكفاءة دون زمن الانتقال الخاص بالنماذج الصوتية الأكبر بكثير.
يقبل عدة ملفات صوتية في تشغيل واحد، مما يتيح لك معالجة عدة تسجيلات دفعة واحدة.
اضبط temperature وtop-k وtop-p لضبط مدى حتمية أو تنوع مخرجات النص المنسوخ.
أضف prompt للنظام أو prompt للمستخدم لتوجيه أسلوب النسخ أو علامات الترقيم أو تنسيق الإخراج.
حدد رموزًا معينة لإيقاف التوليد مبكرًا، مما يمنحك تحكمًا أدق في طول المخرجات.