• Picasso IA लोगो
    Logo Picasso IA
  • होम
  • AI इमेज
    Nano Banana 2
  • AI वीडियो
    Veo 3.1 Lite
  • AI चैट
    Gemini 3 Pro
  • इमेज एडिट करें
  • इमेज सुधारें
  • बैकग्राउंड हटाएं
  • टेक्स्ट टू स्पीच
  • इफ़ेक्ट्स
  • AI Toolkit
    NEW
  • पीढ़ियाँ
  • बिलिंग
  • सहायता
  • खाता
असीमित वीडियो अब उपलब्ध · Nano Banana 2 और GPT Image 2.0 असीमित 25 जून तकअपग्रेड
  1. संग्रह
  2. टेक्स्ट टू स्पीच
  3. Realtime Tts 1.5 Max

अपनी जरूरत के अनुसार आवाज़ें खोजें

ASMR

ASMR

जापानी
फुसफुसाहट
फुसफुसाती महिला

फुसफुसाती महिला

फुसफुसाहट
विश्राम
भाग्यशाली रोबोट

भाग्यशाली रोबोट

रोबोटिक
रचनात्मक
गुस्सैल समुद्री डाकू

गुस्सैल समुद्री डाकू

पात्र
रचनात्मक

ऑडियो टूल्स

मूल ऑडियो
क्लोन किया गया
परिणाम

अपनी आवाज़ क्लोन करें

केवल 10 सेकंड के ऑडियो इनपुट के साथ तुरंत वॉइस मैजिक का अनुभव करें!

अभी शुरू करें
समुद्री डाकू कप्तान
समुद्री डाकू कप्तान
लालची गोब्लिन
लालची गोब्लिन
दक्षिणी सुंदरी
दक्षिणी सुंदरी

वॉइस डिज़ाइन

सरल टेक्स्ट विवरण से कोई भी आवाज़ बनाएं जिसकी आप कल्पना कर सकते हैं

अभी शुरू करें

Realtime TTS 1.5 Max: 200ms से कम AI वॉइसओवर

Realtime TTS 1.5 Max टाइप किए गए टेक्स्ट को 200 मिलीसेकंड से कम में बोले गए ऑडियो में बदल देता है, जिससे यह किसी भी ऐसे संदर्भ के लिए व्यावहारिक हो जाता है जहाँ धीमी वॉइस प्रतिक्रिया अनुभव को बिगाड़ दे। एक वर्चुअल असिस्टेंट के बारे में सोचें जिसे उपयोगकर्ता का ध्यान भटकने से पहले बोलना होता है, या एक कथावाचक जो एनीमेशन के साथ तालमेल में बोलता है। मॉडल स्पष्टता या स्वाभाविकता से समझौता किए बिना उस टाइमिंग को संभालता है। डिफ़ॉल्ट रूप से, आपको 15 समर्थित भाषाएँ और Ashley, Dennis, तथा Alex सहित प्रीसेट आवाज़ों का एक सेट मिलता है, और ब्रांड निरंतरता के लिए एक कस्टम क्लोन की गई वॉइस ID बदलने का विकल्प भी होता है। आप अपने टेक्स्ट में सीधे [happy], [sad], या अन्य टैग लिखकर भावनात्मक स्वर नियंत्रित करते हैं, ताकि आप बिना दोबारा रिकॉर्ड किए किसी पंक्ति को तटस्थ से तनावपूर्ण में बदल सकें। आउटपुट MP3, WAV, OGG Opus, या FLAC में 48 kHz तक आता है, जो वीडियो एडिटर, मोबाइल ऐप, या पॉडकास्ट RSS फ़ीड में सीधे डालने के लिए तैयार है। किसी कंटेंट टीम के लिए, यह वर्कफ़्लो कुछ ऐसा दिखता है: स्क्रिप्ट को एक डॉक में लिखें, उसे Picasso IA में पेस्ट करें, वॉइस और टोन चुनें, फ़ाइल डाउनलोड करें। वॉइस इंटरफ़ेस का प्रोटोटाइप बना रहे किसी डेवलपर के लिए, इसका मतलब है कि कुछ और जटिल जोड़ने से पहले यह सुनना कि प्रतिक्रिया वास्तव में कैसी लगती है। लेटेंसी इतनी कम है कि आप तेज़ी से पुनरावृत्ति कर सकते हैं, अंतर सुन सकते हैं, और आगे बढ़ सकते हैं।

आधिकारिक

Inworld

142.1k रन

Realtime Tts 1.5 Max

2026-03-10

व्यावसायिक उपयोग

Realtime TTS 1.5 Max: 200ms से कम AI वॉइसओवर

विषय-सूची

  • अवलोकन
  • यह कैसे काम करता है
  • अक्सर पूछे जाने वाले प्रश्न
  • क्रेडिट लागत
  • विशेषताएँ
  • उपयोग के मामले
Nano Banana Pro प्राप्त करें

अवलोकन

Realtime TTS 1.5 Max लिखे गए टेक्स्ट को 200ms से कम लेटेंसी के साथ प्राकृतिक-सा भाषण में बदल देता है, जिससे यह किसी भी ऐसे प्रोजेक्ट के लिए सही उपकरण बन जाता है जहाँ प्रतीक्षा अनुभव को खराब कर देती है। चाहे आप एक वॉइस असिस्टेंट बना रहे हों, एक छोटी फ़िल्म के लिए नैरेशन तैयार कर रहे हों, या किसी ऐप में बोला गया संवाद जोड़ रहे हों, धीमी ऑडियो रेंडरिंग प्रवाह को तोड़ देती है। Picasso IA पर, यह मॉडल बिना किसी सेटअप के चलता है: अपना टेक्स्ट पेस्ट करें, एक वॉइस चुनें, और परिणाम लगभग तुरंत सुनें। यह 15 भाषाओं को संभालता है और आपको अपने टेक्स्ट में सीधे रखे गए सरल इनलाइन टैग्स के माध्यम से भावना और गति नियंत्रित करने देता है।

यह कैसे काम करता है

  • इनपुट बॉक्स में 2,000 वर्णों तक का टेक्स्ट टाइप करें या पेस्ट करें। हर पंक्ति की प्रस्तुति को आकार देने के लिए [happy] या [sad] जैसे भावना टैग इनलाइन जोड़ें।
  • एक प्रीसेट वॉइस (जैसे Ashley, Dennis, या Alex) चुनें या यदि आपके पास कोई क्लोन की गई वॉइस है तो उसका कस्टम वॉइस ID दर्ज करें।
  • अपना आउटपुट फ़ॉर्मैट (MP3, WAV, OGG Opus, या FLAC) चुनें और टेलीफ़ोनी से लेकर प्रसारण गुणवत्ता तक गंतव्य से मेल खाने के लिए सैंपल रेट चुनें।
  • वैकल्पिक रूप से, डिलीवरी को तेज़ या धीमा करने के लिए बोलने की गति को सूक्ष्म रूप से समायोजित करें, और आवाज़ कितनी अभिव्यक्तिपूर्ण या तटस्थ लगे इसे नियंत्रित करने के लिए टेम्परेचर समायोजित करें।
  • जनरेट पर क्लिक करें और 200 मिलीसेकंड से कम में अपनी ऑडियो फ़ाइल प्राप्त करें। इसे ब्राउज़र में चलाएँ या सीधे डाउनलोड करें।

अक्सर पूछे जाने वाले प्रश्न

क्या मुझे इसे इस्तेमाल करने के लिए प्रोग्रामिंग कौशल या तकनीकी ज्ञान चाहिए? नहीं, बस Picasso IA पर Realtime TTS 1.5 Max खोलें, अपनी इच्छित सेटिंग्स समायोजित करें, और जनरेट पर क्लिक करें।

क्या इसे आज़माना मुफ़्त है? हाँ, आप बिना किसी पेड सब्सक्रिप्शन के मॉडल चला सकते हैं। मुफ़्त जनरेशन सीमाओं की नवीनतम जानकारी के लिए मौजूदा क्रेडिट नीति देखें।

परिणाम पाने में कितना समय लगता है? मॉडल रियल-टाइम सिंथेसिस के लिए बनाया गया है, जिसका लक्ष्य 200ms से कम लेटेंसी है। व्यवहार में, सबमिट करने के बाद आपको अपना ऑडियो एक सेकंड के अंश में वापस सुनाई देता है।

यह किन भाषाओं का समर्थन करता है? Realtime TTS 1.5 Max 15 भाषाओं को संभालता है। मॉडल पेज पर वॉइस सेलेक्टर वॉइसों को भाषा के अनुसार समूहित करता है, इसलिए सही वॉइस ढूँढने में केवल कुछ सेकंड लगते हैं।

क्या मैं वॉइस की भावना या टोन नियंत्रित कर सकता हूँ? हाँ। अपने टेक्स्ट में सीधे [happy], [sad], या [angry] जैसे इनलाइन मार्कअप टैग जोड़ें, और मॉडल अपनी प्रस्तुति को उसके अनुसार समायोजित करता है। आप SSML break टैग्स से समयबद्ध विराम भी जोड़ सकते हैं और समग्र अभिव्यक्तिशीलता में विविधता लाने के लिए टेम्परेचर स्लाइडर को ऊपर या नीचे कर सकते हैं।

कौन से आउटपुट फ़ॉर्मैट उपलब्ध हैं? आप ऑडियो को MP3, WAV, OGG Opus, या FLAC के रूप में डाउनलोड कर सकते हैं। सैंपल रेट टेलीफ़ोनी के लिए 8 kHz से लेकर प्रसारण-गुणवत्ता वाले प्रोजेक्ट्स के लिए 48 kHz तक कॉन्फ़िगर किया जा सकता है।

क्या मैं जनरेट किया गया ऑडियो व्यावसायिक प्रोजेक्ट्स में उपयोग कर सकता हूँ? एक बार जनरेट होने के बाद फ़ाइलें आपकी होती हैं। व्यावसायिक लाइसेंसिंग और पुनर्वितरण अधिकारों के विवरण के लिए Picasso IA पर सेवा की शर्तें देखें।

क्रेडिट लागत

प्रत्येक जेनरेशन 1 क्रेडिट का उपयोग करता है

1 क्रेडिट

या 5 क्रेडिट्स 5 जेनेरेशन के लिए

विशेषताएँ

यह मॉडल आपके लिए क्या कर सकता है

200ms से कम लेटेंसी

ऑडियो आउटपुट 200 मिलीसेकंड से कम में तैयार हो जाता है, जो लाइव बातचीत और इंटरैक्टिव अनुप्रयोगों के लिए पर्याप्त तेज़ है।

15-भाषा समर्थन

मॉडल बदले बिना एक ही इंटरफ़ेस से 15 भाषाओं में भाषण उत्पन्न करें।

इनलाइन भावना नियंत्रण

वोकल टोन को पंक्ति दर पंक्ति बदलने के लिए अपने टेक्स्ट में सीधे [happy], [sad], या [angry] टैग डालें।

कई ऑडियो फ़ॉर्मैट

MP3, WAV, OGG Opus, या FLAC के रूप में 8 kHz से 48 kHz तक के सैंपल रेट पर एक्सपोर्ट करें।

समायोज्य बोलने की गति

अपने कंटेंट की ज़रूरत के अनुसार डिलीवरी गति मिलाने के लिए मल्टीप्लायर से प्लेबैक स्पीड नियंत्रित करें।

कस्टम वॉइस समर्थन

परियोजनाओं में सुसंगत, ब्रांडेड ऑडियो के लिए बिल्ट-इन प्रीसेट्स के साथ एक क्लोन की गई वॉइस ID का उपयोग करें।

टेक्स्ट सामान्यीकरण

संख्याएँ, तारीख़ें, और संक्षिप्त रूप अपने आप विस्तारित हो जाते हैं ताकि वे सही ढंग से पढ़े जा सकें।

उपयोग के मामले

उत्तर टेक्स्ट पेस्ट करके, एक प्रीसेट वॉइस चुनकर, और कुछ ही सेकंड में ऑडियो क्लिप डाउनलोड करके चैटबॉट प्रतिक्रिया में एक बोली गई आवाज़ जोड़ें

अपनी स्क्रिप्ट टाइप करके, डिलीवरी में विविधता लाने के लिए भावना टैग डालकर, और MP3 के रूप में एक्सपोर्ट करके एक एक्सप्लेनर वीडियो के लिए नैरेशन बनाएं

भाषा सेटिंग बदलकर और एक शब्द भी दोबारा लिखे बिना फिर से चलाकर उसी स्क्रिप्ट को कई भाषाओं में जनरेट करें

सैंपल ऐप प्रतिक्रियाएँ पेस्ट करके और निर्माण से पहले अलग-अलग आवाज़ों और बोलने की गति का अनुभव सुनकर एक वॉइस इंटरफ़ेस का प्रोटोटाइप बनाएं

एक छोटा स्क्रिप्ट लिखकर, भावना मार्कअप के साथ मूड सेट करके, और प्रसारण-तैयार ऑडियो फ़ाइल डाउनलोड करके पॉडकास्ट-शैली के इंट्रो तैयार करें

ट्रांसक्रिप्ट पेस्ट करके और मूल टाइमिंग से मेल खाने के लिए बोलने की गति समायोजित करके एक सिंथेटिक वॉइस के साथ छोटे वीडियो क्लिप को डब करें

निर्देश लाइव होने से पहले वे कैसे सुनाई देते हैं, यह सुनने के लिए अलग-अलग भावनात्मक टोन के साथ ग्राहक सेवा स्क्रिप्ट का परीक्षण करें

श्रेणी बदलें

इफेक्ट्स

टेक्स्ट से इमेज

टेक्स्ट से वीडियो

बड़े भाषा मॉडल

टेक्स्ट से स्पीच

सुपर रेजोल्यूशन

लिपसिंक

AI संगीत निर्माण

वीडियो संपादन

स्पीच से टेक्स्ट

AI वीडियो एन्हांस

बैकग्राउंड हटाएँ