يحوّل Scribe v2 الصوت المنطوق إلى نص مكتوب، ويتعامل مع كل شيء بدءًا من مذكرة صوتية سريعة وصولًا إلى تسجيل مؤتمر مدته 10 ساعات. إذا سبق لك أن أمضيت ساعات في كتابة المقابلات أو ملاحظات الاجتماعات يدويًا، فإن هذا النموذج يختصر هذا العمل إلى ثوانٍ. إنه يقرأ MP3 وWAV وM4A وملفات الفيديو وأكثر من اثني عشر تنسيقًا آخر، لذا لا تحتاج إلى تحويل أي شيء قبل البدء. يدعم النموذج أكثر من 90 لغة ويمكنه اكتشاف اللغة المنطوقة تلقائيًا، مما يجعله عمليًا للتسجيلات متعددة اللغات. يفصل ما يصل إلى 32 متحدثًا مميزًا ويضع علامة على كل كلمة بحسب من قالها، بحيث تبقى نصوص المقابلات الجماعية أو مناقشات اللجان منظمة. يمكنك أيضًا إدخال قائمة بأسماء المنتجات أو المصطلحات التقنية لتوجيه النموذج نحو التهجئة الصحيحة عندما تكون جودة الصوت غير مثالية. يستخدم الصحفيون والباحثون ومحررو البودكاست وفرق دعم العملاء جميعًا أدوات تحويل الكلام إلى نص كخطوة أولى في سير عمل التحرير. يناسب Scribe v2 هذه النقطة طبيعيًا: أدرج ملفك، واحصل على نص منسق نظيف، ثم انتقل مباشرة إلى التحرير أو الترجمة أو إضافة الترجمات. يتم دعم الملفات حتى 3 جيجابايت، لذا فإن الأفلام الكاملة أو حلقات البودكاست الطويلة ليست مشكلة.
يحوّل Scribe v2 الصوت المنطوق إلى نص دقيق عبر أكثر من 90 لغة، ويعيد النتائج بسرعة كافية لتناسب سير عمل تحرير حقيقي. المشكلة التي يحلها هي الوقت: كتابة مقابلة مدتها ساعة يدويًا تستغرق ثلاث إلى أربع ساعات حتى لمن يكتب بسرعة، ولا يزال الناتج يحتاج إلى تصحيح كبير. يؤدي Scribe v2 هذه المهمة نفسها في دقائق، منتجًا نصًا منظمًا مع تسميات للمتحدثين وطوابع زمنية على مستوى الكلمات ووسومًا مضمنة للأصوات الخلفية مثل التصفيق أو الضحك. على Picasso IA، تكون العملية بأكملها مجرد بضع نقرات، دون الحاجة إلى برمجة.
هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Scribe v2 على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط على إنشاء.
هل هو مجاني للتجربة؟ نعم، يمكنك تشغيل Scribe v2 دون اشتراك مدفوع للبدء. تحقق من صفحة التسعير الحالية للحصول على تفاصيل الاعتمادات وخيارات الخطط.
كم من الوقت يستغرق الحصول على النتائج؟ عادةً ما تعود مقطع مدته 10 دقائق في أقل من دقيقة. وتستغرق ساعة كاملة من الصوت عادةً دقيقتين إلى ثلاث دقائق. يؤثر طول الملف والضوضاء الخلفية على وقت المعالجة.
ما صيغ الملفات التي يدعمها؟ يقبل Scribe v2 تنسيقات MP3 وWAV وM4A وFLAC وOGG وOPUS وWebM وAAC وMP4 وMOV وMKV وAVI، والعديد من صيغ الصوت والفيديو الشائعة الأخرى. الحد الأقصى لكل ملف هو 3 جيجابايت و10 ساعات.
هل يمكنه التفريق بين المتحدثين المختلفين في المحادثة؟ نعم. فعّل تحديد المتحدثين قبل التشغيل وسيتم وسم كل كلمة في النص بمعرّف متحدث. يتعامل النموذج مع ما يصل إلى 32 متحدثًا مميزًا في تسجيل واحد.
ماذا لو أخطأ النموذج في تحويل اسم أو مصطلح؟ أضفه إلى حقل المصطلحات الأساسية قبل الإنشاء. يمكنك إدراج ما يصل إلى 1,000 مصطلح، كل منها حتى 50 حرفًا، وسيعطي النموذج تلك الكلمات وزنًا أكبر أثناء التحويل.
أين يمكنني استخدام النصوص التي أنشئها؟ المخرجات نص عادي بدون علامات مائية أو قيود. يمكنك لصقها في مستند، أو إدخالها في محرر ترجمة، أو استخدامها بأي طريقة يتطلبها مشروعك.
كل ما يمكن لهذا النموذج فعله من أجلك
حوّل الصوت إلى نص بأكثر من 90 لغة، مع اكتشاف تلقائي للغة في التسجيلات المختلطة أو غير المعروفة.
تعرّف على ما يصل إلى 32 متحدثًا فرديًا ووسمهم، مع إضافة علامة متحدث لكل كلمة في الناتج.
احصل على أوقات بدء وانتهاء دقيقة لكل كلمة، جاهزة للمزامنة مع ترجمات الفيديو أو التسميات التوضيحية.
علّم الأصوات غير الكلامية مثل الضحك أو التصفيق أو الخطوات مباشرة داخل النص.
قدّم قائمة تصل إلى 1000 تهجئة مفضلة حتى يميل النموذج إلى الشكل الصحيح لأسماء العلامات التجارية والمصطلحات المتخصصة.
ارفع ملفات صوت أو فيديو يصل حجمها إلى 3 جيجابايت و10 ساعات دون الحاجة إلى تقسيمها أو ضغطها أولًا.
أزل كلمات الحشو والبدايات الخاطئة والتلعثم لإنتاج مخرجات مصقولة وسهلة القراءة.
يقبل MP3 وWAV وM4A وFLAC وOGG وMP4 وMOV وMKV والعديد من تنسيقات الصوت والفيديو الأخرى.