• Picasso IA लोगो
    Logo Picasso IA
  • होम
  • AI इमेज
    Nano Banana 2
  • AI वीडियो
    Veo 3.1 Lite
  • AI चैट
    Gemini 3 Pro
  • इमेज एडिट करें
  • इमेज सुधारें
  • बैकग्राउंड हटाएं
  • टेक्स्ट टू स्पीच
  • इफ़ेक्ट्स
  • AI Toolkit
    NEW
  • पीढ़ियाँ
  • बिलिंग
  • सहायता
  • खाता
असीमित वीडियो अब उपलब्ध · Nano Banana 2 और GPT Image 2.0 असीमित 10 जुलाई तकअपग्रेड
  1. संग्रह
  2. AI वीडियो एडिटिंग
  3. Mmaudio

MMAudio के साथ वीडियो में AI-जेनरेट ध्वनि जोड़ें

MMAudio एक मौन या शांत वीडियो लेता है और शुरुआत से सही ऑडियो संश्लेषित करता है, जिससे आप ध्वनि प्रभाव खोजने या ऑडियो संपादकों के साथ काम करने में घंटों बचाते हैं। चाहे आप एक सामग्री निर्माता हों जो एक क्लिप को वास्तविक महसूस कराना चाहते हों या एक वीडियो संपादक जिन्हें त्वरित परिवेश ध्वनि की आवश्यकता है, यह मॉडल दृश्य सामग्री को पढ़ता है और ऑडियो उत्पन्न करता है जो दृश्य के अनुरूप है। मॉडल आपके वीडियो के साथ एक पाठ प्रॉम्प्ट स्वीकार करता है, इसलिए आप आउटपुट को विशिष्ट ध्वनियों जैसे सरसराती हुई पत्तियों, शहर के ट्रैफिक, या भीड़ की गुनगुनाहट की ओर निर्देशित कर सकते हैं। एक नकारात्मक प्रॉम्प्ट आपको अवांछित ध्वनि प्रकार, जैसे संगीत को बाहर करने देता है, जिससे परिणाम सटीक ऑडियो बनावट पर केंद्रित रहता है जिसकी आपको आवश्यकता है। आप गुणवत्ता बनाम पीढ़ी की गति को संतुलित करने के लिए अवधि और अनुमान चरणों को समायोजित कर सकते हैं। MMAudio पोस्ट-प्रोडक्शन में बिना किसी ऑडियो सॉफ्टवेयर या तकनीकी विशेषज्ञता की आवश्यकता के फिट बैठता है। अपनी क्लिप अपलोड करें, जो ध्वनि परिदृश्य चाहते हैं उसका एक संक्षिप्त विवरण लिखें, और एक वीडियो फ़ाइल डाउनलोड करें जिसमें सिंक्रोनाइज़्ड ऑडियो संपादन या प्रकाशन के लिए तैयार है। यह Picasso IA पर मुफ़्त उपलब्ध है, इसलिए आपकी पहली पीढ़ी कुछ ही मिनटों में हो सकती है।

Zsxkib

4.54m रन

Mmaudio

2024-12-11

व्यावसायिक उपयोग

MMAudio के साथ वीडियो में AI-जेनरेट ध्वनि जोड़ें

विषय-सूची

  • अवलोकन
  • यह कैसे काम करता है
  • अक्सर पूछे जाने वाले प्रश्न
  • क्रेडिट लागत
  • विशेषताएँ
  • उपयोग के मामले
  • उदाहरण
Nano Banana Pro प्राप्त करें

अवलोकन

MMAudio AI का उपयोग करके वीडियो सामग्री से सिंक्रोनाइज़्ड ऑडियो उत्पन्न करता है, जो वीडियो पोस्ट-प्रोडक्शन के सबसे समय लेने वाले भागों में से एक को हल करता है: ध्वनि ढूंढना या बनाना जो वास्तव में स्क्रीन पर क्या है इससे मेल खाता है। Picasso IA पर, आप एक मौन या कम-ऑडियो क्लिप अपलोड करते हैं, वह ध्वनि का वर्णन करते हैं जो आप चाहते हैं, और मॉडल ऑडियो संश्लेषित करता है जो दृश्य संदर्भ से मेल खाता है। एक फिल्मकार बाहरी दृश्य में परिवेश बारिश जोड़ रहा है, एक सोशल मीडिया निर्माता को खाना पकाने के वीडियो के लिए सूक्ष्म पदचिन्ह की आवश्यकता है, या एक एनिमेटर को तकनीकी डेमो के लिए नरम मशीन की गुनगुनाहट चाहिए, ये सभी बिना किसी ऑडियो सॉफ्टवेयर के इसका उपयोग कर सकते हैं। परिणाम एक डाउनलोड योग्य वीडियो फ़ाइल है जिसमें उत्पन्न ऑडियो पहले से ही एम्बेड किया गया है और उपयोग के लिए तैयार है।

यह कैसे काम करता है

  • अपनी वीडियो फ़ाइल को मॉडल इनपुट पैनल पर अपलोड करें।
  • ऐसी ध्वनियों का वर्णन करते हुए एक पाठ प्रॉम्प्ट लिखें जो आप चाहते हैं, जैसे "पत्तियों पर हल्की बारिश" या "व्यस्त कॉफी शॉप का माहौल।"
  • वैकल्पिक रूप से एक नकारात्मक प्रॉम्प्ट जोड़ें ताकि आप जो ध्वनि नहीं चाहते, जैसे संगीत या भाषण, को बाहर कर सकें, जिससे आउटपुट इस पर केंद्रित रहे जो आपको आवश्यकता है।
  • अपनी क्लिप की लंबाई से मेल खाने के लिए अवधि को समायोजित करें और गुणवत्ता और गति के बीच संतुलन को नियंत्रित करने के लिए अनुमान चरणों की संख्या सेट करें।
  • काम जमा करें और अपनी वीडियो डाउनलोड करें जिसमें संश्लेषित ऑडियो ट्रैक पहले से ही संलग्न है।

अक्सर पूछे जाने वाले प्रश्न

क्या इसे उपयोग करने के लिए मुझे प्रोग्रामिंग कौशल या तकनीकी ज्ञान की आवश्यकता है?
नहीं, बस MMAudio को Picasso IA पर खोलें, जो सेटिंग्स चाहते हैं उन्हें समायोजित करें, और जेनरेट दबाएं।

क्या MMAudio को आजमाने के लिए मुफ़्त है?
हां, आप Picasso IA पर साइन अप किए बिना मॉडल को मुफ़्त में चला सकते हैं। लंबी या उच्च-गुणवत्ता वाली पीढ़ी के लिए क्रेडिट लागू हो सकते हैं।

परिणाम प्राप्त करने में कितना समय लगता है?
अधिकांश पीढ़ी 8 सेकंड तक की क्लिप के लिए एक मिनट से कम समय में समाप्त हो जाती है। लंबी क्लिप या उच्च अनुमान चरण गिनती में थोड़ा अधिक समय लग सकता है।

MMAudio कौन सा आउटपुट प्रारूप लौटाता है?
मॉडल एक वीडियो फ़ाइल लौटाता है जिसमें उत्पन्न ऑडियो पहले से ही मर्ज किया गया है, डाउनलोड करने और आपकी संपादन समयरेखा में डालने के लिए तैयार है।

क्या मैं ऑडियो शैली या सामग्री को अनुकूलित कर सकता हूं?
हां। पाठ प्रॉम्प्ट आपको किसी भी ध्वनि वातावरण को सादी भाषा में वर्णित करने देता है, और नकारात्मक प्रॉम्प्ट आपको संगीत या आवाज जैसे विशिष्ट ध्वनि प्रकार को बाहर करने देता है। CFG शक्ति सेटिंग नियंत्रित करती है कि आउटपुट आपके प्रॉम्प्ट का कितने निकटता से पालन करता है।

यदि जेनरेट की गई ऑडियो वीडियो से अच्छी तरह से मेल नहीं खाती तो क्या होता है?
अधिक विशिष्ट विवरणकर्ताओं के साथ अपने पाठ प्रॉम्प्ट को परिष्कृत करने का प्रयास करें, बेहतर गुणवत्ता के लिए अनुमान चरणों की संख्या बढ़ाएं, या ऑडियो की एक नई भिन्नता पाने के लिए एक अलग यादृच्छिक बीज का उपयोग करें।

क्रेडिट लागत

प्रत्येक जेनरेशन 10 क्रेडिट्स का उपयोग करता है

10 क्रेडिट्स

या 50 क्रेडिट्स 5 जेनेरेशन के लिए

विशेषताएँ

यह मॉडल आपके लिए क्या कर सकता है

वीडियो-से-ऑडियो सिंक

ऑडियो उत्पन्न करता है जो आपके अपलोड की गई वीडियो की दृश्य सामग्री और समय से मेल खाता है।

पाठ प्रॉम्प्ट नियंत्रण

ध्वनि आउटपुट को सादी भाषा का उपयोग करके निर्देशित करता है ताकि आप जो सुनना चाहते हैं उसका सटीक वर्णन कर सकें।

नकारात्मक प्रॉम्प्ट फ़िल्टरिंग

नकारात्मक प्रॉम्प्ट फ़ील्ड में उन्हें सूचीबद्ध करके संगीत या आवाज जैसी अवांछित ध्वनि प्रकार को बाहर करता है।

समायोज्य अवधि

आउटपुट ऑडियो लंबाई को कुछ सेकंड से सेट करें ताकि आपकी क्लिप की पूरी लंबाई से मेल खाए।

अनुमान चरण नियंत्रण

उच्च ऑडियो विश्वस्तता के लिए चरणों की संख्या बढ़ाएं या तेजी से परिणाम के लिए उन्हें कम करें।

कोई ऑडियो संपादन की आवश्यकता नहीं

एक वीडियो अपलोड करें और बिना किसी पोस्ट-प्रोसेसिंग के एक समाप्त ऑडियो-सिंक्ड फ़ाइल प्राप्त करें।

बीज-आधारित पुनरुत्पादनशीलता

संशोधन में स्थिरता के लिए समान ऑडियो आउटपुट को पुनः उत्पन्न करने के लिए एक बीज मान को पुनः उपयोग करें।

उच्च गुणवत्ता, संदर्भ-सचेत ऑडियो आउटपुट

उपयोग के मामले

वीडियो अपलोड करके और पर्यावरण का वर्णन करके, जैसे पेड़ों के माध्यम से हवा या दूर की चिड़िया की बोली, एक यात्रा क्लिप में परिवेश बाहरी ध्वनि जोड़ें।

यातायात और भीड़ की ध्वनियों के लिए प्रॉम्प्ट करके एक स्ट्रीट फोटोग्राफी मॉन्टेज के लिए शहर के शोर उत्पन्न करें जो दृश्य मनोदशा से मेल खाती है।

वन्यजीव फुटेज के लिए प्रकृति की ध्वनि परिदृश्य बनाएं जो दृश्य के ऊपर लेयर करना चाहते हैं उस विशिष्ट पर्यावरण ऑडियो का वर्णन करके।

एनिमेटेड सामग्री या गति ग्राफिक्स में यथार्थवादी ध्वनि प्रभाव जोड़ें जो स्क्रीन पर गति से मेल खाती है उन कार्रवाई ध्वनियों का वर्णन करके।

उत्पाद डेमो वीडियो के लिए सिंक्रोनाइज़्ड परिवेश ऑडियो का उत्पादन करें उन सूक्ष्म ध्वनियों का वर्णन करके जो स्क्रीन पर संदर्भ से फिट हैं।

इवेंट हाइलाइट्स के लिए भीड़ का माहौल जेनरेट करें जहां मूल ऑडियो बहुत शोरगुल या पूरी तरह से मौन था।

नकारात्मक प्रॉम्प्ट का उपयोग करके संगीत को बाहर करने और केवल पर्यावरण ऑडियो बनावट रखने के लिए छोटी फिल्मों के लिए वायुमंडलीय ध्वनि बनाएं।

AI-संचालित ऑडियो रचनात्मकता के साथ प्रयोग करें

उदाहरण

8s
-1
1m 18s
Num Steps: 25
Cfg Strength: 4.5
music

galloping

10s
0
5.3s
Num Steps: 25
Cfg Strength: 4.5
10s
0
3.8s
Num Steps: 25
Cfg Strength: 4.5

typing

10s
0
17.3s
Num Steps: 25
Cfg Strength: 4.5

storm

10s
0
18.4s
Num Steps: 25
Cfg Strength: 4.5

waves, storm

10s
0
1m 23s
Num Steps: 25
Cfg Strength: 4.5

waves, seagulls

10s
0
3m 16s
Num Steps: 25
Cfg Strength: 4.5

Indian holy music

10s
0
5m 14s
Num Steps: 25
Cfg Strength: 4.5
music
10s
0
6m 4s
Num Steps: 25
Cfg Strength: 4.5

श्रेणी बदलें

इफेक्ट्स

टेक्स्ट से इमेज

टेक्स्ट से वीडियो

बड़े भाषा मॉडल

टेक्स्ट से स्पीच

सुपर रेजोल्यूशन

लिपसिंक

AI संगीत निर्माण

वीडियो संपादन

स्पीच से टेक्स्ट

AI वीडियो एन्हांस

बैकग्राउंड हटाएँ