• Picasso IA लोगो
    Logo Picasso IA
  • होम
  • AI इमेज
    Nano Banana 2
  • AI वीडियो
    Veo 3.1 Lite
  • AI चैट
    Gemini 3 Pro
  • इमेज एडिट करें
  • इमेज सुधारें
  • बैकग्राउंड हटाएं
  • टेक्स्ट टू स्पीच
  • इफ़ेक्ट्स
  • AI Toolkit
    NEW
  • पीढ़ियाँ
  • बिलिंग
  • सहायता
  • खाता
असीमित वीडियो अब उपलब्ध · Nano Banana 2 और GPT Image 2.0 असीमित 25 जून तकअपग्रेड
  1. संग्रह
  2. टेक्स्ट टू स्पीच
  3. Realtime Tts 2

अपनी जरूरत के अनुसार आवाज़ें खोजें

ASMR

ASMR

जापानी
फुसफुसाहट
फुसफुसाती महिला

फुसफुसाती महिला

फुसफुसाहट
विश्राम
भाग्यशाली रोबोट

भाग्यशाली रोबोट

रोबोटिक
रचनात्मक
गुस्सैल समुद्री डाकू

गुस्सैल समुद्री डाकू

पात्र
रचनात्मक

ऑडियो टूल्स

मूल ऑडियो
क्लोन किया गया
परिणाम

अपनी आवाज़ क्लोन करें

केवल 10 सेकंड के ऑडियो इनपुट के साथ तुरंत वॉइस मैजिक का अनुभव करें!

अभी शुरू करें
समुद्री डाकू कप्तान
समुद्री डाकू कप्तान
लालची गोब्लिन
लालची गोब्लिन
दक्षिणी सुंदरी
दक्षिणी सुंदरी

वॉइस डिज़ाइन

सरल टेक्स्ट विवरण से कोई भी आवाज़ बनाएं जिसकी आप कल्पना कर सकते हैं

अभी शुरू करें

Realtime TTS 2 के साथ प्राकृतिक-भाषा AI वॉयसओवर

Realtime TTS 2 एक टेक्स्ट-टू-स्पीच मॉडल है, जो उन रचनाकारों के लिए बनाया गया है जो अपनी स्क्रिप्ट पढ़ने वाले किसी रोबोट से ज़्यादा चाहते हैं। यह आपको सादी अंग्रेज़ी में प्रदर्शन को निर्देशित करने देता है, आपके टेक्स्ट में कहीं भी टोन और भावना के संकेत जोड़कर, ताकि आउटपुट किसी असली वॉइस एक्टर जैसा लगे, न कि एक डिफ़ॉल्ट AI रीडर जैसा। चाहे आप पॉडकास्ट इंट्रो, वीडियो नैरेशन, या बहुभाषी दर्शकों के लिए डब किया गया ऑडियो बना रहे हों, मॉडल सब कुछ रियल टाइम में बिना किसी ध्यान देने योग्य देरी के प्रोसेस करता है. प्राकृतिक-भाषा स्टीयरिंग सिस्टम ही इसे अलग बनाता है: [say excitedly] या [whisper in a hushed style] जैसी कोई निर्देशावली किसी भी वाक्यांश से पहले लिखें, और मॉडल अपनी प्रस्तुति उसी के अनुसार समायोजित कर लेता है। इनलाइन नॉन-वर्बल टैग्स आपको हँसी, आहें, खाँसी, या प्राकृतिक साँसों की आवाज़ें वाक्य के बीच में जोड़ने देते हैं, जिससे ऑडियो कम कृत्रिम महसूस होता है। मॉडल स्वतः भाषा पहचान के साथ 100+ भाषाओं का भी समर्थन करता है, इसलिए बहुभाषी स्क्रिप्ट्स को सेटिंग्स मैन्युअल रूप से बदले बिना संभाला जा सकता है. Realtime TTS 2 किसी भी ऑडियो या वीडियो प्रोडक्शन वर्कफ़्लो में स्वाभाविक रूप से फिट बैठता है। अपनी स्क्रिप्ट को टेक्स्ट फ़ील्ड में पेस्ट करें, एक आवाज़ चुनें, अपना आउटपुट फ़ॉर्मैट (MP3, WAV, FLAC, या OGG) चुनें, और कुछ ही सेकंड में एक साफ़ फ़ाइल डाउनलोड करें। यदि पहली कोशिश सही नहीं है, तो टोन निर्देश बदलें या temperature सेटिंग समायोजित करें और फिर से जनरेट करें।

आधिकारिक

Inworld

23.7k रन

Realtime Tts 2

2026-05-04

व्यावसायिक उपयोग

Realtime TTS 2 के साथ प्राकृतिक-भाषा AI वॉयसओवर

विषय-सूची

  • अवलोकन
  • यह कैसे काम करता है
  • अक्सर पूछे जाने वाले प्रश्न
  • क्रेडिट लागत
  • विशेषताएँ
  • उपयोग के मामले
Nano Banana Pro प्राप्त करें

अवलोकन

Realtime TTS 2 लिखे गए टेक्स्ट को प्राकृतिक लगने वाली स्पीच में बदलता है, उस अभिव्यंजक गहराई के साथ जो सामान्य वॉयस जनरेटर में नहीं होती। अगर आपने कभी कोई वॉयसओवर सुना है और तुरंत महसूस किया है कि वह मशीन द्वारा बनाया गया था, तो यह मॉडल सीधे उस समस्या को संबोधित करता है। यह 100 से अधिक भाषाओं का समर्थन करता है, आपके टेक्स्ट के अंदर कोष्ठकों में दिए गए भावना संकेत स्वीकार करता है (जैसे [say excitedly] या [whisper softly]), और कम लेटेंसी पर ऑडियो देता है, जिससे यह लाइव अनुप्रयोगों और तेज़ इटररेशन के लिए व्यावहारिक बनता है। Picasso IA पर, आप इसे बिना कुछ इंस्टॉल किए सीधे अपने ब्राउज़र में चला सकते हैं.

यह कैसे काम करता है

  • अपने टेक्स्ट को इनपुट बॉक्स में टाइप या पेस्ट करें, प्रति अनुरोध 2,000 वर्ण तक।
  • उस वाक्यांश से पहले, जिसे आप आकार देना चाहते हैं, कोष्ठकों में वैकल्पिक इनलाइन निर्देश जोड़ें, जैसे [say sadly] या [laugh], ताकि प्रस्तुति का टोन और गैर-मौखिक ध्वनियाँ निर्देशित की जा सकें।
  • ड्रॉपडाउन से अपनी भाषा चुनें, या यदि आपका टेक्स्ट एक ही पहचानी जा सकने वाली भाषा में है तो इसे auto-detect पर छोड़ दें।
  • एक पूर्वनिर्धारित आवाज़ चुनें (Ashley, Dennis, Alex, या Darlene) या यदि आपके पास सेटअप है तो एक कस्टम वॉयस ID दर्ज करें।
  • बोलने की गति, temperature, और आउटपुट फ़ॉर्मैट (MP3, WAV, OGG, या FLAC) समायोजित करें, फिर अपना ऑडियो फ़ाइल प्राप्त करने के लिए generate पर क्लिक करें।

अक्सर पूछे जाने वाले प्रश्न

क्या इसका उपयोग करने के लिए मुझे प्रोग्रामिंग कौशल या तकनीकी ज्ञान चाहिए? नहीं, बस Picasso IA पर Realtime TTS 2 खोलें, जो सेटिंग्स आप चाहते हैं उन्हें समायोजित करें, और generate दबाएँ।

क्या इसे आज़माना मुफ़्त है? हाँ, शुरू करने के लिए आप भुगतान वाली सदस्यता के बिना Picasso IA पर Realtime TTS 2 चला सकते हैं। जनरेशन सीमाओं के लिए pricing page पर वर्तमान plan विवरण देखें।

परिणाम पाने में कितना समय लगता है? मॉडल रियल-टाइम latency के लिए बनाया गया है, इसलिए अधिकांश छोटे से मध्यम टेक्स्ट कुछ सेकंड के भीतर ऑडियो लौटाते हैं। 2,000-वर्ण सीमा के निकट लंबे इनपुट server load के आधार पर थोड़ा अधिक समय ले सकते हैं।

कौन से आउटपुट फ़ॉर्मैट समर्थित हैं? आप अपना ऑडियो MP3, WAV, OGG Opus, या FLAC के रूप में डाउनलोड कर सकते हैं। MP3 डिफ़ॉल्ट है और लगभग हर प्लेटफ़ॉर्म पर काम करता है। यदि आपको पेशेवर या स्टूडियो उपयोग के लिए lossless गुणवत्ता चाहिए, तो FLAC सबसे अच्छा विकल्प है।

क्या मैं नियंत्रित कर सकता हूँ कि आवाज़ कैसी लगे? हाँ। भावना और प्रस्तुति शैली को निर्देशित करने के लिए अपने टेक्स्ट में [whisper] या [say excitedly] जैसे कोष्ठकयुक्त निर्देशों का उपयोग करें। temperature स्लाइडर बढ़ाने से अधिक अभिव्यंजक विविधता जुड़ती है; इसे कम करने से टोन सुसंगत और तटस्थ रहता है। speaking rate नियंत्रण आपको टोन से स्वतंत्र रूप से प्रस्तुति को धीमा या तेज़ करने देता है।

यह किन भाषाओं का समर्थन करता है? मॉडल 15 production भाषाओं को संभालता है, जिनमें English, Spanish, French, German, Chinese, Japanese, Korean, Arabic, और Hindi शामिल हैं। भाषा को auto पर सेट करने से मॉडल उसे स्वयं पहचान लेता है, जो स्पष्ट रूप से लिखे गए एकल-भाषा टेक्स्ट के लिए अच्छा काम करता है।

मैं इसके द्वारा उत्पन्न ऑडियो का उपयोग कहाँ कर सकता हूँ? आउटपुट फ़ाइलें साफ़ होती हैं और किसी भी प्रोजेक्ट में सीधे डाली जा सकती हैं। सामान्य उपयोगों में सोशल मीडिया वीडियो, पॉडकास्ट संपादन, ऐप इंटरफ़ेस, e-learning मॉड्यूल, और ग्राहक सेवा डेमो शामिल हैं। ऑडियो में कोई अंतर्निहित watermark नहीं होता।

क्रेडिट लागत

प्रत्येक जेनरेशन 1 क्रेडिट का उपयोग करता है

1 क्रेडिट

या 5 क्रेडिट्स 5 जेनेरेशन के लिए

विशेषताएँ

यह मॉडल आपके लिए क्या कर सकता है

प्राकृतिक-भाषा टोन नियंत्रण

अपनी स्क्रिप्ट के साथ सादे अंग्रेज़ी में निर्देश इनलाइन लिखें ताकि हर पंक्ति के प्रस्तुतीकरण को आकार दिया जा सके।

100+ भाषा समर्थन

स्वचालित भाषा पहचान के साथ, अरबी, चीनी, हिंदी और जापानी सहित 100 से अधिक भाषाओं में स्पीच जनरेट करें।

रियल-टाइम जनरेशन

ऑडियो इतना तेज़ बनता है कि लाइव या लगभग-लाइव अनुप्रयोगों के लिए बफरिंग देरी के बिना उपयोग किया जा सके।

गैर-मौखिक ध्वनि सम्मिलन

ऑडियो में कहीं भी प्रामाणिक हँसी, आहें, खाँसी, या साँस की आवाज़ें जोड़ने के लिए इनलाइन टैग्स रखें।

चार निर्यात फ़ॉर्मैट

किसी भी प्लेटफ़ॉर्म या संपादन वर्कफ़्लो के अनुकूल बनने के लिए अपने ऑडियो को MP3, WAV, FLAC, या OGG के रूप में डाउनलोड करें।

समायोज्य बोलने की गति

अपने वीडियो या प्रस्तुति की गति के अनुरूप एक साधारण गुणक के साथ प्रस्तुति को तेज़ या धीमा करें।

टेम्परेचर नियंत्रण

अभिव्यंजकता को ऊपर या नीचे समायोजित करें ताकि एक समान पठन या अधिक गतिशील, विविध प्रदर्शन प्राप्त हो सके।

पूर्वनिर्धारित और कस्टम आवाज़ें

अंतर्निर्मित वॉयस प्रोफ़ाइल्स में से चुनें या व्यक्तिगत आउटपुट के लिए एक कस्टम क्लोन की गई वॉयस ID प्रदान करें।

उपयोग के मामले

अपनी स्क्रिप्ट पेस्ट करके और वाक्यांशों को [say calmly] या [say with urgency] जैसे टोन निर्देशों से घेरकर YouTube या सोशल मीडिया वीडियो के लिए वॉयसओवर रिकॉर्ड करें

अनुवादित टेक्स्ट लिखकर और सेटिंग्स में लक्ष्य भाषा चुनकर उसी वॉयसओवर को किसी दूसरी भाषा में जनरेट करें

हर एपिसोड में आपके शो के टोन से मेल खाने वाली एक सुसंगत AI आवाज़ के साथ पॉडकास्ट इंट्रो और एपिसोड नैरेशन बनाएं

पाठ में सीधे inline ऑडियो टैग्स डालकर रिकॉर्डिंग में हँसी, आहें, या गला साफ़ करने जैसी गैर-मौखिक आवाज़ें जोड़ें

प्रत्येक भाषा के लिए अलग वॉयस एक्टर को नियुक्त किए बिना बहुभाषी वीडियो सामग्री के लिए डब किया गया ऑडियो तैयार करें

जो श्रोता ऑडियो पसंद करते हैं उनके लिए लंबी-फ़ॉर्म लेखों या ब्लॉग पोस्ट्स को MP3 या WAV फ़ॉर्मैट में डाउनलोड करने योग्य ऑडियो फ़ाइलों में बदलें

अंतिम उत्पाद की आवाज़ तय करने से पहले समायोज्य बोलने की गति और विविध अभिव्यंजकता के साथ वॉयस असिस्टेंट संवाद का प्रोटोटाइप बनाएं

श्रेणी बदलें

इफेक्ट्स

टेक्स्ट से इमेज

टेक्स्ट से वीडियो

बड़े भाषा मॉडल

टेक्स्ट से स्पीच

सुपर रेजोल्यूशन

लिपसिंक

AI संगीत निर्माण

वीडियो संपादन

स्पीच से टेक्स्ट

AI वीडियो एन्हांस

बैकग्राउंड हटाएँ