• Picasso IA लोगो
    Logo Picasso IA
  • होम
  • AI इमेज
    Nano Banana 2
  • AI वीडियो
    Veo 3.1 Lite
  • AI चैट
    Gemini 3 Pro
  • इमेज एडिट करें
  • इमेज सुधारें
  • बैकग्राउंड हटाएं
  • टेक्स्ट टू स्पीच
  • इफ़ेक्ट्स
    NEW
  • पीढ़ियाँ
  • बिलिंग
  • सहायता
  • खाता
  1. संग्रह
  2. AI वीडियो एडिटिंग
  3. Mmaudio

MMAudio के साथ वीडियो में AI-जेनरेट ध्वनि जोड़ें

MMAudio एक मौन या शांत वीडियो लेता है और शुरुआत से सही ऑडियो संश्लेषित करता है, जिससे आप ध्वनि प्रभाव खोजने या ऑडियो संपादकों के साथ काम करने में घंटों बचाते हैं। चाहे आप एक सामग्री निर्माता हों जो एक क्लिप को वास्तविक महसूस कराना चाहते हों या एक वीडियो संपादक जिन्हें त्वरित परिवेश ध्वनि की आवश्यकता है, यह मॉडल दृश्य सामग्री को पढ़ता है और ऑडियो उत्पन्न करता है जो दृश्य के अनुरूप है। मॉडल आपके वीडियो के साथ एक पाठ प्रॉम्प्ट स्वीकार करता है, इसलिए आप आउटपुट को विशिष्ट ध्वनियों जैसे सरसराती हुई पत्तियों, शहर के ट्रैफिक, या भीड़ की गुनगुनाहट की ओर निर्देशित कर सकते हैं। एक नकारात्मक प्रॉम्प्ट आपको अवांछित ध्वनि प्रकार, जैसे संगीत को बाहर करने देता है, जिससे परिणाम सटीक ऑडियो बनावट पर केंद्रित रहता है जिसकी आपको आवश्यकता है। आप गुणवत्ता बनाम पीढ़ी की गति को संतुलित करने के लिए अवधि और अनुमान चरणों को समायोजित कर सकते हैं। MMAudio पोस्ट-प्रोडक्शन में बिना किसी ऑडियो सॉफ्टवेयर या तकनीकी विशेषज्ञता की आवश्यकता के फिट बैठता है। अपनी क्लिप अपलोड करें, जो ध्वनि परिदृश्य चाहते हैं उसका एक संक्षिप्त विवरण लिखें, और एक वीडियो फ़ाइल डाउनलोड करें जिसमें सिंक्रोनाइज़्ड ऑडियो संपादन या प्रकाशन के लिए तैयार है। यह Picasso IA पर मुफ़्त उपलब्ध है, इसलिए आपकी पहली पीढ़ी कुछ ही मिनटों में हो सकती है।

Zsxkib

4.54m रन

Mmaudio

2024-12-11

व्यावसायिक उपयोग

MMAudio के साथ वीडियो में AI-जेनरेट ध्वनि जोड़ें

विषय-सूची

  • अवलोकन
  • यह कैसे काम करता है
  • अक्सर पूछे जाने वाले प्रश्न
  • क्रेडिट लागत
  • विशेषताएँ
  • उपयोग के मामले
Nano Banana Pro प्राप्त करें

अवलोकन

MMAudio AI का उपयोग करके वीडियो सामग्री से सिंक्रोनाइज़्ड ऑडियो उत्पन्न करता है, जो वीडियो पोस्ट-प्रोडक्शन के सबसे समय लेने वाले भागों में से एक को हल करता है: ध्वनि ढूंढना या बनाना जो वास्तव में स्क्रीन पर क्या है इससे मेल खाता है। Picasso IA पर, आप एक मौन या कम-ऑडियो क्लिप अपलोड करते हैं, वह ध्वनि का वर्णन करते हैं जो आप चाहते हैं, और मॉडल ऑडियो संश्लेषित करता है जो दृश्य संदर्भ से मेल खाता है। एक फिल्मकार बाहरी दृश्य में परिवेश बारिश जोड़ रहा है, एक सोशल मीडिया निर्माता को खाना पकाने के वीडियो के लिए सूक्ष्म पदचिन्ह की आवश्यकता है, या एक एनिमेटर को तकनीकी डेमो के लिए नरम मशीन की गुनगुनाहट चाहिए, ये सभी बिना किसी ऑडियो सॉफ्टवेयर के इसका उपयोग कर सकते हैं। परिणाम एक डाउनलोड योग्य वीडियो फ़ाइल है जिसमें उत्पन्न ऑडियो पहले से ही एम्बेड किया गया है और उपयोग के लिए तैयार है।

यह कैसे काम करता है

  • अपनी वीडियो फ़ाइल को मॉडल इनपुट पैनल पर अपलोड करें।
  • ऐसी ध्वनियों का वर्णन करते हुए एक पाठ प्रॉम्प्ट लिखें जो आप चाहते हैं, जैसे "पत्तियों पर हल्की बारिश" या "व्यस्त कॉफी शॉप का माहौल।"
  • वैकल्पिक रूप से एक नकारात्मक प्रॉम्प्ट जोड़ें ताकि आप जो ध्वनि नहीं चाहते, जैसे संगीत या भाषण, को बाहर कर सकें, जिससे आउटपुट इस पर केंद्रित रहे जो आपको आवश्यकता है।
  • अपनी क्लिप की लंबाई से मेल खाने के लिए अवधि को समायोजित करें और गुणवत्ता और गति के बीच संतुलन को नियंत्रित करने के लिए अनुमान चरणों की संख्या सेट करें।
  • काम जमा करें और अपनी वीडियो डाउनलोड करें जिसमें संश्लेषित ऑडियो ट्रैक पहले से ही संलग्न है।

अक्सर पूछे जाने वाले प्रश्न

क्या इसे उपयोग करने के लिए मुझे प्रोग्रामिंग कौशल या तकनीकी ज्ञान की आवश्यकता है?
नहीं, बस MMAudio को Picasso IA पर खोलें, जो सेटिंग्स चाहते हैं उन्हें समायोजित करें, और जेनरेट दबाएं।

क्या MMAudio को आजमाने के लिए मुफ़्त है?
हां, आप Picasso IA पर साइन अप किए बिना मॉडल को मुफ़्त में चला सकते हैं। लंबी या उच्च-गुणवत्ता वाली पीढ़ी के लिए क्रेडिट लागू हो सकते हैं।

परिणाम प्राप्त करने में कितना समय लगता है?
अधिकांश पीढ़ी 8 सेकंड तक की क्लिप के लिए एक मिनट से कम समय में समाप्त हो जाती है। लंबी क्लिप या उच्च अनुमान चरण गिनती में थोड़ा अधिक समय लग सकता है।

MMAudio कौन सा आउटपुट प्रारूप लौटाता है?
मॉडल एक वीडियो फ़ाइल लौटाता है जिसमें उत्पन्न ऑडियो पहले से ही मर्ज किया गया है, डाउनलोड करने और आपकी संपादन समयरेखा में डालने के लिए तैयार है।

क्या मैं ऑडियो शैली या सामग्री को अनुकूलित कर सकता हूं?
हां। पाठ प्रॉम्प्ट आपको किसी भी ध्वनि वातावरण को सादी भाषा में वर्णित करने देता है, और नकारात्मक प्रॉम्प्ट आपको संगीत या आवाज जैसे विशिष्ट ध्वनि प्रकार को बाहर करने देता है। CFG शक्ति सेटिंग नियंत्रित करती है कि आउटपुट आपके प्रॉम्प्ट का कितने निकटता से पालन करता है।

यदि जेनरेट की गई ऑडियो वीडियो से अच्छी तरह से मेल नहीं खाती तो क्या होता है?
अधिक विशिष्ट विवरणकर्ताओं के साथ अपने पाठ प्रॉम्प्ट को परिष्कृत करने का प्रयास करें, बेहतर गुणवत्ता के लिए अनुमान चरणों की संख्या बढ़ाएं, या ऑडियो की एक नई भिन्नता पाने के लिए एक अलग यादृच्छिक बीज का उपयोग करें।

क्रेडिट लागत

प्रत्येक जेनरेशन 10 क्रेडिट्स का उपयोग करता है

10 क्रेडिट्स

या 50 क्रेडिट्स 5 जेनेरेशन के लिए

विशेषताएँ

यह मॉडल आपके लिए क्या कर सकता है

वीडियो-से-ऑडियो सिंक

ऑडियो उत्पन्न करता है जो आपके अपलोड की गई वीडियो की दृश्य सामग्री और समय से मेल खाता है।

पाठ प्रॉम्प्ट नियंत्रण

ध्वनि आउटपुट को सादी भाषा का उपयोग करके निर्देशित करता है ताकि आप जो सुनना चाहते हैं उसका सटीक वर्णन कर सकें।

नकारात्मक प्रॉम्प्ट फ़िल्टरिंग

नकारात्मक प्रॉम्प्ट फ़ील्ड में उन्हें सूचीबद्ध करके संगीत या आवाज जैसी अवांछित ध्वनि प्रकार को बाहर करता है।

समायोज्य अवधि

आउटपुट ऑडियो लंबाई को कुछ सेकंड से सेट करें ताकि आपकी क्लिप की पूरी लंबाई से मेल खाए।

अनुमान चरण नियंत्रण

उच्च ऑडियो विश्वस्तता के लिए चरणों की संख्या बढ़ाएं या तेजी से परिणाम के लिए उन्हें कम करें।

कोई ऑडियो संपादन की आवश्यकता नहीं

एक वीडियो अपलोड करें और बिना किसी पोस्ट-प्रोसेसिंग के एक समाप्त ऑडियो-सिंक्ड फ़ाइल प्राप्त करें।

बीज-आधारित पुनरुत्पादनशीलता

संशोधन में स्थिरता के लिए समान ऑडियो आउटपुट को पुनः उत्पन्न करने के लिए एक बीज मान को पुनः उपयोग करें।

उच्च गुणवत्ता, संदर्भ-सचेत ऑडियो आउटपुट

उपयोग के मामले

वीडियो अपलोड करके और पर्यावरण का वर्णन करके, जैसे पेड़ों के माध्यम से हवा या दूर की चिड़िया की बोली, एक यात्रा क्लिप में परिवेश बाहरी ध्वनि जोड़ें।

यातायात और भीड़ की ध्वनियों के लिए प्रॉम्प्ट करके एक स्ट्रीट फोटोग्राफी मॉन्टेज के लिए शहर के शोर उत्पन्न करें जो दृश्य मनोदशा से मेल खाती है।

वन्यजीव फुटेज के लिए प्रकृति की ध्वनि परिदृश्य बनाएं जो दृश्य के ऊपर लेयर करना चाहते हैं उस विशिष्ट पर्यावरण ऑडियो का वर्णन करके।

एनिमेटेड सामग्री या गति ग्राफिक्स में यथार्थवादी ध्वनि प्रभाव जोड़ें जो स्क्रीन पर गति से मेल खाती है उन कार्रवाई ध्वनियों का वर्णन करके।

उत्पाद डेमो वीडियो के लिए सिंक्रोनाइज़्ड परिवेश ऑडियो का उत्पादन करें उन सूक्ष्म ध्वनियों का वर्णन करके जो स्क्रीन पर संदर्भ से फिट हैं।

इवेंट हाइलाइट्स के लिए भीड़ का माहौल जेनरेट करें जहां मूल ऑडियो बहुत शोरगुल या पूरी तरह से मौन था।

नकारात्मक प्रॉम्प्ट का उपयोग करके संगीत को बाहर करने और केवल पर्यावरण ऑडियो बनावट रखने के लिए छोटी फिल्मों के लिए वायुमंडलीय ध्वनि बनाएं।

AI-संचालित ऑडियो रचनात्मकता के साथ प्रयोग करें

श्रेणी बदलें

इफेक्ट्स

टेक्स्ट से इमेज

टेक्स्ट से इमेज

टेक्स्ट से वीडियो

बड़े भाषा मॉडल

बड़े भाषा मॉडल

टेक्स्ट से स्पीच

टेक्स्ट से स्पीच

सुपर रेजोल्यूशन

सुपर रेजोल्यूशन

लिपसिंक

AI संगीत निर्माण

AI संगीत निर्माण

वीडियो संपादन

स्पीच से टेक्स्ट

स्पीच से टेक्स्ट

AI वीडियो एन्हांस

AI वीडियो एन्हांस

बैकग्राउंड हटाएँ

बैकग्राउंड हटाएँ