Realtime TTS 2 هو نموذج تحويل النص إلى كلام مصمم للمبدعين الذين يريدون أكثر من مجرد قراءة آلية لنصهم. يتيح لك توجيه الأداء باللغة الإنجليزية البسيطة، مع إضافة إشارات النبرة والعاطفة في أي مكان داخل نصك، بحيث يبدو الإخراج كأنه من ممثل صوتي حقيقي، وليس قارئًا افتراضيًا بالذكاء الاصطناعي. سواء كنت تنتج مقدمات بودكاست أو تعليقًا صوتيًا لمقاطع فيديو أو صوتًا مدبلجًا لجمهور متعدد اللغات، فإن النموذج يعالج كل شيء في الوقت الفعلي دون تأخير ملحوظ. نظام التوجيه باللغة الطبيعية هو ما يميّزه: اكتب تعليمات مثل [say excitedly] أو [whisper in a hushed style] قبل أي عبارة، وسيقوم النموذج بتعديل طريقة الأداء وفقًا لذلك. تتيح لك العلامات غير اللفظية المضمنة إدراج الضحك أو التنهدات أو السعال أو أصوات التنفس الطبيعية في منتصف الجملة لجعل الصوت أقل اصطناعية. كما يدعم النموذج أكثر من 100 لغة مع اكتشاف تلقائي للغة، بحيث تتم معالجة النصوص متعددة اللغات دون الحاجة إلى تبديل الإعدادات يدويًا. يندمج Realtime TTS 2 بشكل طبيعي في أي سير عمل لإنتاج الصوت أو الفيديو. الصق نصك في حقل النص، واختر صوتًا، وحدد تنسيق الإخراج (MP3 أو WAV أو FLAC أو OGG)، ثم نزّل ملفًا نظيفًا في ثوانٍ. إذا لم تكن المحاولة الأولى مناسبة، فغيّر تعليمات النبرة أو عدّل إعداد temperature وأعد التوليد مرة أخرى.
يحوّل Realtime TTS 2 النص المكتوب إلى كلام طبيعي المظهر بعمق تعبيري تفتقده مولدات الصوت العامة. إذا سبق لك أن استمعت إلى تعليق صوتي وأدركت فورًا أنه مصنوع آليًا، فإن هذا النموذج يعالج تلك المشكلة مباشرة. يدعم أكثر من 100 لغة، ويقبل إشارات عاطفية داخل أقواس في نصك (مثل [say excitedly] أو [whisper softly])، ويقدم الصوت بزمن وصول منخفض، ما يجعله عمليًا للتطبيقات المباشرة والتكرار السريع. على Picasso IA، يمكنك تشغيله مباشرة في متصفحك دون تثبيت أي شيء.
هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Realtime TTS 2 على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط generate.
هل هو مجاني للتجربة؟ نعم، يمكنك تشغيل Realtime TTS 2 على Picasso IA دون اشتراك مدفوع للبدء. تحقق من تفاصيل الخطة الحالية في صفحة الأسعار لمعرفة حدود التوليد.
كم يستغرق الحصول على النتائج؟ تم تصميم النموذج بزمن وصول في الوقت الفعلي، لذا تعود معظم النصوص القصيرة إلى المتوسطة بصوت خلال بضع ثوانٍ. قد تستغرق المدخلات الأطول القريبة من حد 2,000 حرف وقتًا أطول قليلًا حسب حمل الخادم.
ما تنسيقات الإخراج المدعومة؟ يمكنك تنزيل الصوت بصيغة MP3 أو WAV أو OGG Opus أو FLAC. MP3 هو التنسيق الافتراضي ويعمل عبر почти كل منصة. FLAC هو الخيار الأفضل إذا كنت تحتاج إلى جودة بلا فقدان للاستخدام المهني أو الاستديو.
هل يمكنني التحكم في شكل الصوت؟ نعم. استخدم التعليمات بين أقواس في نصك، مثل [whisper] أو [say excitedly]، لتوجيه العاطفة وأسلوب الأداء. يؤدي رفع شريط temperature إلى إضافة مزيد من التنوع التعبيري؛ بينما يخفضه للحفاظ على نبرة متسقة ومحايدة. يتيح لك التحكم في سرعة الكلام إبطاء الأداء أو تسريعه بشكل مستقل عن النبرة.
ما اللغات التي يدعمها؟ يتعامل النموذج مع 15 لغة إنتاج، بما في ذلك الإنجليزية والإسبانية والفرنسية والألمانية والصينية واليابانية والكورية والعربية والهندية، وغيرها. يتيح ضبط اللغة على auto للنموذج اكتشافها تلقائيًا، وهو ما يعمل جيدًا مع النصوص أحادية اللغة المكتوبة بوضوح.
أين يمكنني استخدام الصوت الذي ينتجه؟ ملفات الإخراج نظيفة وجاهزة للإدراج في أي مشروع. تشمل المواضع الشائعة مقاطع وسائل التواصل الاجتماعي، وتعديلات البودكاست، وواجهات التطبيقات، ووحدات التعلم الإلكتروني، وعروض خدمة العملاء. لا يحتوي الصوت على علامات مائية مضمّنة.
كل ما يمكن لهذا النموذج فعله من أجلك
اكتب تعليمات أسلوب باللغة الإنجليزية البسيطة داخل نصك لتشكيل كيفية أداء كل سطر.
أنشئ كلامًا بأكثر من 100 لغة، بما في ذلك العربية والصينية والهندية واليابانية، مع اكتشاف تلقائي للغة.
يتم إنتاج الصوت بسرعة كافية للتطبيقات المباشرة أو شبه المباشرة دون تأخير في التخزين المؤقت.
ضع علامات مضمنة لإضافة ضحكات أو تنهدات أو سعال أو أصوات تنفس طبيعية في أي مكان داخل الصوت.
نزّل الصوت بصيغة MP3 أو WAV أو FLAC أو OGG ليتناسب مع أي منصة أو سير عمل للتحرير.
زد سرعة الأداء أو خففها باستخدام معامل بسيط لمطابقة وتيرة الفيديو أو العرض التقديمي.
ارفع مستوى التعبير أو خفّضه للحصول على قراءة متسقة أو أداء أكثر ديناميكية وتنوعًا.
اختر من ملفات تعريف صوتية مدمجة أو قدّم معرّف صوت مستنسخ مخصصًا لإخراج شخصي.