• Picasso IA लोगो
    Logo Picasso IA
  • होम
  • AI इमेज
    Nano Banana 2
  • AI वीडियो
    Veo 3.1 Lite
  • AI चैट
    Gemini 3 Pro
  • इमेज एडिट करें
  • इमेज सुधारें
  • बैकग्राउंड हटाएं
  • टेक्स्ट टू स्पीच
  • इफ़ेक्ट्स
    NEW
  • पीढ़ियाँ
  • बिलिंग
  • सहायता
  • खाता
  1. संग्रह
  2. टेक्स्ट टू स्पीच
  3. Grok Text To Speech

अपनी जरूरत के अनुसार आवाज़ें खोजें

ASMR

ASMR

जापानी
फुसफुसाहट
फुसफुसाती महिला

फुसफुसाती महिला

फुसफुसाहट
विश्राम
भाग्यशाली रोबोट

भाग्यशाली रोबोट

रोबोटिक
रचनात्मक
गुस्सैल समुद्री डाकू

गुस्सैल समुद्री डाकू

पात्र
रचनात्मक

ऑडियो टूल्स

मूल ऑडियो
क्लोन किया गया
परिणाम

अपनी आवाज़ क्लोन करें

केवल 10 सेकंड के ऑडियो इनपुट के साथ तुरंत वॉइस मैजिक का अनुभव करें!

अभी शुरू करें
समुद्री डाकू कप्तान
समुद्री डाकू कप्तान
लालची गोब्लिन
लालची गोब्लिन
दक्षिणी सुंदरी
दक्षिणी सुंदरी

वॉइस डिज़ाइन

सरल टेक्स्ट विवरण से कोई भी आवाज़ बनाएं जिसकी आप कल्पना कर सकते हैं

अभी शुरू करें

Grok Text To Speech: त्वरित AI ऑडियो ऑनलाइन

Grok Text To Speech लिखी हुई स्क्रिप्ट्स को बिना रिकॉर्डिंग सेटअप के प्राकृतिक ऑडियो में बदल देता है। यह वॉयस आर्टिस्ट्स का इंतज़ार करने या स्टूडियो समय बुक करने की बाधा को हटाता है, जिससे आप कुछ ही सेकंड में एक टेक्स्ट प्रॉम्प्ट से तैयार ऑडियो फ़ाइल बना सकते हैं। नैरेटर, प्रोडक्ट टीमें, और डेवलपर्स इसे कोर्स नैरेशन से लेकर स्वचालित फ़ोन सिस्टम तक हर चीज़ के लिए उपयोग करते हैं। पाँच वॉइस विकल्प डिलीवरी शैलियों की एक विस्तृत श्रृंखला को कवर करते हैं, उत्साही और जोशीले से लेकर शांत और प्रभावशाली तक। इनलाइन स्पीच टैग्स आपको सटीक पेसिंग नियंत्रण के लिए सीधे अपनी स्क्रिप्ट में विराम, हँसी, या फुसफुसाए गए हिस्से जोड़ने देते हैं। आउटपुट MP3, WAV, PCM, और टेलीफोनी कोडेक्स में, कई सैंपल रेट्स के साथ आते हैं, जो अधिकांश ऑडियो वर्कफ़्लो की तकनीकी आवश्यकताओं से मेल खाते हैं। अपनी स्क्रिप्ट पेस्ट करें, एक आवाज़ और फ़ॉर्मैट चुनें, और फ़ाइल कुछ ही सेकंड में तैयार हो जाती है। वीडियो प्रोजेक्ट्स के लिए, अंतिम रिकॉर्डिंग पर जाने से पहले इसे एक अस्थायी नैरेशन ट्रैक के रूप में उपयोग करें। टेलीफोनी के लिए, mulaw या alaw के रूप में एक्सपोर्ट करें और सीधे अपने IVR सिस्टम में अपलोड करें। Picasso IA पर कुछ पंक्तियाँ चलाना ही काफी है यह सुनने के लिए कि प्रत्येक आवाज़ आपके ब्रांड टोन के साथ कैसी लगती है।

आधिकारिक

Xai

213 रन

Grok Text To Speech

2026-04-28

व्यावसायिक उपयोग

Grok Text To Speech: त्वरित AI ऑडियो ऑनलाइन

विषय-सूची

  • अवलोकन
  • यह कैसे काम करता है
  • अक्सर पूछे जाने वाले प्रश्न
  • क्रेडिट लागत
  • विशेषताएँ
  • उपयोग के मामले
Nano Banana Pro प्राप्त करें

अवलोकन

Grok Text To Speech किसी भी लिखे हुए इनपुट से प्राकृतिक-सा ऑडियो बनाता है, जिसमें 20 भाषाएँ और पाँच वॉइस व्यक्तित्व शामिल हैं, जिनके टोन और डिलीवरी शैलियाँ अलग-अलग हैं। अगर आपको एक वीडियो, पॉडकास्ट इंट्रो, या रिकॉर्ड किए गए संदेश के लिए वॉइसओवर चाहिए लेकिन माइक्रोफ़ोन या वॉयस टैलेंट उपलब्ध नहीं है, तो यह उस अंतर को भर देता है। Picasso IA पर, आप अपना टेक्स्ट पेस्ट करते हैं, एक आवाज़ चुनते हैं, और कुछ ही सेकंड में एक साफ़ ऑडियो फ़ाइल प्राप्त करते हैं। मॉडल 15,000 वर्ण तक की स्क्रिप्ट स्वीकार करता है और विराम, हँसी, या फुसफुसाए गए अंश जैसे इनलाइन स्पीच टैग्स को सीधे आपके टेक्स्ट से पढ़ता है।

यह कैसे काम करता है

  • अपना टेक्स्ट इनपुट फ़ील्ड में पेस्ट या टाइप करें (प्रति रन 15,000 वर्ण तक)
  • पाँच विकल्पों में से एक आवाज़ चुनें: उत्साही और जोशीली, गर्म और मित्रवत, आत्मविश्वासी और स्पष्ट, स्मूद और संतुलित, या प्रभावशाली और मज़बूत
  • अपना आउटपुट फ़ॉर्मैट चुनें (सामान्य उपयोग के लिए MP3, लॉसलेस ऑडियो के लिए WAV, या फ़ोन-आधारित सिस्टम के लिए टेलीफोनी कोडेक्स)
  • 20 समर्थित विकल्पों में से अपनी लक्षित भाषा सेट करें, या इसे ऑटो-डिटेक्ट पर छोड़ दें और मॉडल को आपके टेक्स्ट से भाषा पहचानने दें
  • जनरेट पर क्लिक करें और Picasso IA से अपनी तैयार ऑडियो फ़ाइल डाउनलोड करें

अक्सर पूछे जाने वाले प्रश्न

क्या इसे इस्तेमाल करने के लिए मुझे प्रोग्रामिंग कौशल या तकनीकी ज्ञान चाहिए? नहीं, बस Picasso IA पर Grok Text To Speech खोलें, अपनी पसंद की सेटिंग्स समायोजित करें, और जनरेट पर क्लिक करें।

क्या इसे आज़माना मुफ़्त है? हाँ, आप बिना किसी अग्रिम भुगतान के मॉडल चला सकते हैं। अपने वर्तमान बैलेंस और प्लान विवरण के लिए क्रेडिट्स पैनल देखें।

परिणाम मिलने में कितना समय लगता है? अधिकांश अनुरोध कुछ ही सेकंड में पूरे हो जाते हैं। 15,000-वर्ण सीमा के नज़दीक लंबे टेक्स्ट में थोड़ा अधिक समय लग सकता है, लेकिन तैयार ऑडियो आम तौर पर 20 सेकंड से कम में मिल जाता है।

कौन-से आउटपुट फ़ॉर्मैट समर्थित हैं? आप सामान्य साझा करने के लिए MP3, लॉसलेस गुणवत्ता के लिए WAV, रॉ ऑडियो पाइपलाइनों के लिए PCM, या टेलीफोनी सिस्टम्स के लिए mulaw और alaw फ़ॉर्मैट्स में ऑडियो डाउनलोड कर सकते हैं। आप सैंपल रेट और, MP3 के लिए, बिट रेट भी स्वतंत्र रूप से नियंत्रित कर सकते हैं।

क्या मैं टोन, पेसिंग, या डिलीवरी शैली नियंत्रित कर सकता हूँ? हाँ। मॉडल आपके टेक्स्ट में सीधे लिखे गए इनलाइन स्पीच टैग्स को पढ़ता है। वाक्यों के बीच [pause] डालें, प्राकृतिक विराम के लिए [laugh] जोड़ें, या किसी अंश को whisper टैग्स में लपेटें ताकि वह हिस्सा कैसे पढ़ा जाए, इसे बदला जा सके।

यह कितनी भाषाओं का समर्थन करता है? मॉडल अंग्रेज़ी, फ़्रेंच, जर्मन, स्पेनिश, जापानी, कोरियाई, अरबी, हिंदी, पुर्तगाली, चीनी, और अधिक सहित 20 भाषाओं को कवर करता है। भाषा को BCP-47 कोड के साथ मैन्युअल रूप से सेट करें या ऑटो-डिटेक्ट का उपयोग करें और मॉडल को आपके इनपुट से यह पहचानने दें।

मैं जो ऑडियो फ़ाइलें जनरेट करता हूँ, उनका उपयोग कहाँ कर सकता हूँ? फ़ाइलें बिना वॉटरमार्क या एम्बेडेड ब्रांडिंग के साफ़ डाउनलोड होती हैं। आप उन्हें वीडियो प्रोजेक्ट्स, पॉडकास्ट एपिसोड्स, ई-लर्निंग कोर्सेज़, वॉइसमेल रिकॉर्डिंग्स, या किसी भी अन्य संदर्भ में उपयोग कर सकते हैं जिसे बोले गए ऑडियो की आवश्यकता हो।

क्रेडिट लागत

प्रत्येक जेनरेशन 1 क्रेडिट का उपयोग करता है

1 क्रेडिट

या 5 क्रेडिट्स 5 जेनेरेशन के लिए

विशेषताएँ

यह मॉडल आपके लिए क्या कर सकता है

पाँच वॉइस शैलियाँ

अपने कंटेंट के टोन से मेल खाने के लिए उत्साही, गर्म, आत्मविश्वासी, स्मूद, या प्रभावशाली डिलीवरी में से चुनें।

अभिव्यंजक स्पीच टैग्स

सटीक पेसिंग नियंत्रण के लिए अपनी स्क्रिप्ट में सीधे इनलाइन विराम, हँसी, और फुसफुसाहटें जोड़ें।

20-भाषा समर्थन

किसी भी समर्थित भाषा में ऑडियो जनरेट करें, या मॉडल को पहले टेक्स्ट पढ़ने देने के लिए ऑटो-डिटेक्ट सेट करें।

कई ऑडियो कोडेक्स

अपनी पाइपलाइन की तकनीकी ज़रूरतों के अनुसार MP3, WAV, PCM, mulaw, या alaw के रूप में एक्सपोर्ट करें।

समायोज्य ऑडियो गुणवत्ता

टेलीफोनी के लिए 8kHz से लेकर प्रसारण-स्तरीय आउटपुट के लिए 48kHz तक सैंपल रेट सेट करें।

टेक्स्ट नॉर्मलाइज़ेशन

जनरेशन से पहले संख्याओं, संक्षेपों, और प्रतीकों को स्वचालित रूप से बोले जाने वाले रूप में बदलें।

लंबे-फ़ॉर्म समर्थन

प्रति रन 15,000 वर्ण तक प्रोसेस करें, जो एक पूरी लेख या बहु-पृष्ठ स्क्रिप्ट के लिए पर्याप्त है।

उपयोग के मामले

अपनी स्क्रिप्ट पेस्ट करके और अपने ब्रांड से मेल खाने वाली आत्मविश्वासी आवाज़ चुनकर एक प्रोडक्ट डेमो वीडियो के लिए वॉइसओवर जनरेट करें

अपने दर्शकों को हाथ-मुक्त सुनने का विकल्प देने के लिए एक लिखे हुए लेख से पॉडकास्ट-शैली का ऑडियो तैयार करें

री-रिकॉर्डिंग के बिना रन के बीच भाषा कोड बदलकर प्रस्तुतियों के लिए बहुभाषी नैरेशन बनाएं

अपनी स्क्रिप्ट में इनलाइन स्पीच टैग्स का उपयोग करके एक ऑडियोबुक अध्याय में अभिव्यंजक विराम और फुसफुसाए गए हिस्से जोड़ें

सही आउटपुट कोडेक और सैंपल रेट चुनकर 8kHz पर टेलीफोनी-तैयार mulaw फ़ॉर्मैट में IVR फ़ोन प्रॉम्प्ट्स बनाएं

एक ही स्क्रिप्ट को सभी पाँच आवाज़ों से चलाकर और टोन की तुलना करके एक विज्ञापन अभियान के लिए आवाज़ की व्यक्तित्वों का परीक्षण करें

एक साफ़ WAV फ़ाइल एक्सपोर्ट करके एक लिखित कोर्स मॉड्यूल को सुलभता अनुपालन के लिए बोले जाने वाले ऑडियो में बदलें

श्रेणी बदलें

इफेक्ट्स

टेक्स्ट से इमेज

टेक्स्ट से इमेज

टेक्स्ट से वीडियो

बड़े भाषा मॉडल

बड़े भाषा मॉडल

टेक्स्ट से स्पीच

टेक्स्ट से स्पीच

सुपर रेजोल्यूशन

सुपर रेजोल्यूशन

लिपसिंक

AI संगीत निर्माण

AI संगीत निर्माण

वीडियो संपादन

स्पीच से टेक्स्ट

स्पीच से टेक्स्ट

AI वीडियो एन्हांस

AI वीडियो एन्हांस

बैकग्राउंड हटाएँ

बैकग्राउंड हटाएँ