• شعار Picasso IA
    Logo Picasso IA
  • الرئيسية
  • صورة ذكاء اصطناعي
    Nano Banana 2
  • فيديو ذكاء اصطناعي
    Veo 3.1 Lite
  • دردشة ذكاء اصطناعي
    Gemini 3 Pro
  • تحرير الصور
  • تحسين الصورة
  • إزالة الخلفية
  • تحويل النص إلى كلام
  • التأثيرات
  • AI Toolkit
    NEW
  • التوليدات
  • الفواتير
  • الدعم
  • الحساب
فيديوهات غير محدودة متاحة الآن · Nano Banana 2 و GPT Image 2.0 غير محدودين حتى ٢٥ يونيوترقية
  1. مجموعة
  2. تحويل النص إلى كلام
  3. Realtime Tts 1.5 Mini

استكشف الأصوات التي تناسب احتياجاتك

ASMR

ASMR

ياباني
همس
امرأة همسية

امرأة همسية

همس
الاسترخاء
روبوت محظوظ

روبوت محظوظ

آلي
إبداعي
قرصان غاضب

قرصان غاضب

شخصية
إبداعي

أدوات الصوت

الصوت الأصلي
مستنسخ
النتيجة

استنسخ صوتك

اختبر سحر الصوت الفوري مع 10 ثوانٍ فقط من المدخلات الصوتية!

ابدأ الآن
قبطان القراصنة
قبطان القراصنة
العفريت الجشع
العفريت الجشع
حسناء الجنوب
حسناء الجنوب

تصميم الصوت

أنشئ أي صوت يمكنك تخيله - من وصف نصي بسيط

ابدأ الآن

Realtime TTS 1.5 Mini: تركيب صوتي بالذكاء الاصطناعي خلال 120 مللي ثانية

يحوّل Realtime TTS 1.5 Mini النص المكتوب إلى صوت منطوق في نحو 120 مللي ثانية، مما يجعله أحد أسرع خيارات تحويل النص إلى كلام المتاحة. إذا سبق أن انتظرت عدة ثوانٍ حتى يتم إنشاء الصوت قبل عرض توضيحي أو تفاعل مع عميل أو اختبار منتج مباشر، فإن هذا النموذج يقلّص ذلك الانتظار إلى جزء من الثانية. يعمل عبر 15 لغة، لذا يتيح إعداد واحد التعامل مع المحتوى متعدد اللغات دون الحاجة إلى التنقل بين أدوات متعددة. يمكنك تشكيل المخرجات بعدة طرق. تغيّر علامات المشاعر مثل [happy] أو [sad] نبرة المتحدث دون أي خطوة معالجة إضافية. تتيح لك علامات التوقف في SSML التحكم في أماكن الوقفات، مما يمنحك الإيقاع الذي تحتاجه للسرد أو الحوار. يقبل النموذج معدلات عينات من 8 kHz إلى 48 kHz ويصدر الصوت بصيغ MP3 أو WAV أو OGG Opus أو FLAC، بحيث يناسب الملف أي منصة أو خط معالجة يستقبله. وتتحكم قيمة temperature في مدى تعبير الأداء أو ثباته عبر التشغيلات المتكررة. بالنسبة للتطبيقات المعتمدة على الصوت، أو روبوتات الهاتف التفاعلية، أو سرد الدورات التدريبية عبر الإنترنت، أو أي مشروع تُعد فيه تأخيرات الصوت قيدًا حقيقيًا، يندمج هذا النموذج بسهولة دون الحاجة إلى تغيير كبير في البنية التحتية. أدخل نصك، واختر صوتًا ولغة، واحصل على ملف صوتي جاهز للاستخدام في أقل من ثانية.

رسمي

Inworld

89.6k تشغيل

Realtime Tts 1.5 Mini

2026-03-10

الاستخدام التجاري

Realtime TTS 1.5 Mini: تركيب صوتي بالذكاء الاصطناعي خلال 120 مللي ثانية

جدول المحتويات

  • نظرة عامة
  • كيف يعمل
  • الأسئلة الشائعة
  • تكلفة الأرصدة
  • الميزات
  • حالات الاستخدام
احصل على Nano Banana Pro

نظرة عامة

يحوّل Realtime TTS 1.5 Mini النص المكتوب إلى كلام طبيعي في نحو 120 مللي ثانية، مما يجعله أحد أسرع نماذج التركيب المتاحة للتطبيقات المباشرة. إذا كنت تبني روبوت دعم عملاء أو مساعد قراءة أو واجهة صوتية تحتاج إلى الاستجابة في الوقت الفعلي، فإن الانتظار ثانيتين أو ثلاثًا حتى يظهر الصوت يُعد عائقًا حاسمًا. يستضيف Picasso IA هذا النموذج بحيث يمكنك اختباره مباشرة في المتصفح، دون الحاجة إلى إعداد API. وهو يغطي 15 لغة مباشرة، لذا يتعامل نموذج واحد مع المشاريع متعددة اللغات دون تبديل الأدوات.

كيف يعمل

  • اكتب نصك أو الصقه في حقل الإدخال، بحد أقصى 2,000 حرف لكل طلب
  • اختر صوتًا جاهزًا من المكتبة أو قدّم معرّف صوت مستنسخ مخصص
  • اضبط معدل الكلام ودرجة temperature للتحكم في السرعة والتعبير، واختر صيغة الإخراج (MP3، WAV، OGG، FLAC)
  • حدد معدل العينات الذي يناسب بيئة الهدف، من 8 kHz للاتصالات الهاتفية حتى 48 kHz للصوت عالي الدقة
  • اضغط على generate واحصل على ملفك الصوتي في أقل من ثانية لمعظم المدخلات

الأسئلة الشائعة

هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Realtime TTS 1.5 Mini على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط generate.

هل التجربة مجانية؟ يتيح لك Picasso IA تشغيل النموذج دون إنشاء حساب أو إدخال تفاصيل الدفع. يمكنك إنشاء الصوت والاستماع إليه مباشرة في المتصفح قبل تنزيل أي شيء.

كم يستغرق الحصول على النتائج؟ يستهدف النموذج نحو 120 مللي ثانية من الإدخال إلى الصوت. عمليًا، تُعرض معظم النصوص القصيرة إلى المتوسطة في أقل من ثانية بكثير، حتى على اتصال إنترنت قياسي.

ما صيغ الإخراج المدعومة؟ يمكنك تنزيل الصوت بصيغة MP3 أو WAV أو OGG Opus أو FLAC. صيغة MP3 هي الافتراضية وتعمل في تقريبًا كل البيئات. اختر FLAC أو WAV إذا كنت تحتاج إلى صوت غير مضغوط للتحرير بعد الإنتاج.

هل يمكنني التحكم في نبرة الصوت وسرعته؟ نعم. يضبط إعداد temperature مدى التعبير أو الحياد في الصوت. يتيح لك معامل speaking rate تسريع الأداء أو إبطاءه دون تغيير طبقة الصوت. يمكنك أيضًا إدراج علامات التوقف وعلامات المشاعر مباشرة في نصك لتشكيل الوقفات والنبرة في لحظات محددة.

ما اللغات التي يدعمها النموذج؟ يغطي النموذج 15 لغة، لذا يمكنك تركيب الكلام عبر عدة مناطق محلية باستخدام سير العمل نفسه دون الانتقال إلى نموذج مختلف لكل لغة.

ماذا يحدث إذا لم أكن راضيًا عن النتيجة؟ جرّب ضبط شريط temperature على مستوى مختلف من التعبير، أو انتقل إلى صوت آخر من المكتبة الجاهزة. كما أن التغييرات الصغيرة في صياغة النص المصدر يمكن أن تؤثر بوضوح في مدى طبيعية الصوت الناتج.

تكلفة الأرصدة

كل توليد يستهلك 1 رصيد

1 رصيد

أو 5 أرصدة لـ 5 توليدات

الميزات

كل ما يمكن لهذا النموذج فعله من أجلك

زمن انتقال ~120 مللي ثانية

يُخرج الصوت بسرعة تكفي لتطبيقات الصوت المباشر وخطوط المعالجة الآنية.

دعم 15 لغة

أنشئ كلامًا بخمس عشرة لغة مختلفة من خلال استدعاء API واحد.

ترميز المشاعر

أدرج [happy] أو [sad] أو علامات مشابهة لتغيير النبرة العاطفية للمتحدث.

صيغ صوت مرنة

حمّل المخرجات بصيغة MP3 أو WAV أو OGG Opus أو FLAC لتناسب أي منصة.

أصوات مخصصة

استخدم أسماء جاهزة مثل Ashley أو Dennis، أو قدّم معرّف صوت مستنسخ خاص بك.

تحكم SSML في التوقفات

ضع فواصل طبيعية في أي موضع داخل النص باستخدام علامات break time.

معدل عينات قابل للتعديل

اختر من 8 kHz إلى 48 kHz لتحقيق التوازن بين حجم الملف ودقة الصوت.

تطبيع النص

وسّع الأرقام والتواريخ والاختصارات تلقائيًا قبل التركيب.

حالات الاستخدام

أنشئ تعليمات صوتية لشرح تطبيق هاتف محمول في أقل من ثانية لكل جملة

أنتج إعلانات منتجات متعددة اللغات بما يصل إلى 15 لغة من قالب نصي واحد

أنشئ ردود خدمة عملاء منطوقة لروبوت محادثة يحتاج إلى إيصال الردود في الوقت الفعلي

أضف سردًا موسومًا بالمشاعر إلى نص فيديو عبر إدراج علامات [happy] أو [sad] في النص

ابنِ معاينة لكتاب صوتي عبر تحويل فصل تجريبي إلى MP3 أو WAV بإيقاع طبيعي

أدرج توقفات زمنية في مقدمات البودكاست باستخدام علامات SSML break لإحساس مكتوب ومصقول

اختبر أصوات متحدثين مختلفة على النص نفسه لاختيار النبرة التي تناسب علامتك التجارية قبل الإطلاق

تبديل الفئة

تأثيرات

تحويل النص إلى صورة

تحويل النص إلى فيديو

نماذج اللغة الكبيرة

تحويل النص إلى كلام

دقة فائقة

مزامنة الشفاه

توليد الموسيقى بالذكاء الاصطناعي

تحرير الفيديو

تحويل الكلام إلى نص

تحسين الفيديو بالذكاء الاصطناعي

إزالة الخلفية