MMAudio एक मौन या शांत वीडियो लेता है और शुरुआत से सही ऑडियो संश्लेषित करता है, जिससे आप ध्वनि प्रभाव खोजने या ऑडियो संपादकों के साथ काम करने में घंटों बचाते हैं। चाहे आप एक सामग्री निर्माता हों जो एक क्लिप को वास्तविक महसूस कराना चाहते हों या एक वीडियो संपादक जिन्हें त्वरित परिवेश ध्वनि की आवश्यकता है, यह मॉडल दृश्य सामग्री को पढ़ता है और ऑडियो उत्पन्न करता है जो दृश्य के अनुरूप है। मॉडल आपके वीडियो के साथ एक पाठ प्रॉम्प्ट स्वीकार करता है, इसलिए आप आउटपुट को विशिष्ट ध्वनियों जैसे सरसराती हुई पत्तियों, शहर के ट्रैफिक, या भीड़ की गुनगुनाहट की ओर निर्देशित कर सकते हैं। एक नकारात्मक प्रॉम्प्ट आपको अवांछित ध्वनि प्रकार, जैसे संगीत को बाहर करने देता है, जिससे परिणाम सटीक ऑडियो बनावट पर केंद्रित रहता है जिसकी आपको आवश्यकता है। आप गुणवत्ता बनाम पीढ़ी की गति को संतुलित करने के लिए अवधि और अनुमान चरणों को समायोजित कर सकते हैं। MMAudio पोस्ट-प्रोडक्शन में बिना किसी ऑडियो सॉफ्टवेयर या तकनीकी विशेषज्ञता की आवश्यकता के फिट बैठता है। अपनी क्लिप अपलोड करें, जो ध्वनि परिदृश्य चाहते हैं उसका एक संक्षिप्त विवरण लिखें, और एक वीडियो फ़ाइल डाउनलोड करें जिसमें सिंक्रोनाइज़्ड ऑडियो संपादन या प्रकाशन के लिए तैयार है। यह Picasso IA पर मुफ़्त उपलब्ध है, इसलिए आपकी पहली पीढ़ी कुछ ही मिनटों में हो सकती है।
MMAudio AI का उपयोग करके वीडियो सामग्री से सिंक्रोनाइज़्ड ऑडियो उत्पन्न करता है, जो वीडियो पोस्ट-प्रोडक्शन के सबसे समय लेने वाले भागों में से एक को हल करता है: ध्वनि ढूंढना या बनाना जो वास्तव में स्क्रीन पर क्या है इससे मेल खाता है। Picasso IA पर, आप एक मौन या कम-ऑडियो क्लिप अपलोड करते हैं, वह ध्वनि का वर्णन करते हैं जो आप चाहते हैं, और मॉडल ऑडियो संश्लेषित करता है जो दृश्य संदर्भ से मेल खाता है। एक फिल्मकार बाहरी दृश्य में परिवेश बारिश जोड़ रहा है, एक सोशल मीडिया निर्माता को खाना पकाने के वीडियो के लिए सूक्ष्म पदचिन्ह की आवश्यकता है, या एक एनिमेटर को तकनीकी डेमो के लिए नरम मशीन की गुनगुनाहट चाहिए, ये सभी बिना किसी ऑडियो सॉफ्टवेयर के इसका उपयोग कर सकते हैं। परिणाम एक डाउनलोड योग्य वीडियो फ़ाइल है जिसमें उत्पन्न ऑडियो पहले से ही एम्बेड किया गया है और उपयोग के लिए तैयार है।
क्या इसे उपयोग करने के लिए मुझे प्रोग्रामिंग कौशल या तकनीकी ज्ञान की आवश्यकता है?
नहीं, बस MMAudio को Picasso IA पर खोलें, जो सेटिंग्स चाहते हैं उन्हें समायोजित करें, और जेनरेट दबाएं।
क्या MMAudio को आजमाने के लिए मुफ़्त है?
हां, आप Picasso IA पर साइन अप किए बिना मॉडल को मुफ़्त में चला सकते हैं। लंबी या उच्च-गुणवत्ता वाली पीढ़ी के लिए क्रेडिट लागू हो सकते हैं।
परिणाम प्राप्त करने में कितना समय लगता है?
अधिकांश पीढ़ी 8 सेकंड तक की क्लिप के लिए एक मिनट से कम समय में समाप्त हो जाती है। लंबी क्लिप या उच्च अनुमान चरण गिनती में थोड़ा अधिक समय लग सकता है।
MMAudio कौन सा आउटपुट प्रारूप लौटाता है?
मॉडल एक वीडियो फ़ाइल लौटाता है जिसमें उत्पन्न ऑडियो पहले से ही मर्ज किया गया है, डाउनलोड करने और आपकी संपादन समयरेखा में डालने के लिए तैयार है।
क्या मैं ऑडियो शैली या सामग्री को अनुकूलित कर सकता हूं?
हां। पाठ प्रॉम्प्ट आपको किसी भी ध्वनि वातावरण को सादी भाषा में वर्णित करने देता है, और नकारात्मक प्रॉम्प्ट आपको संगीत या आवाज जैसे विशिष्ट ध्वनि प्रकार को बाहर करने देता है। CFG शक्ति सेटिंग नियंत्रित करती है कि आउटपुट आपके प्रॉम्प्ट का कितने निकटता से पालन करता है।
यदि जेनरेट की गई ऑडियो वीडियो से अच्छी तरह से मेल नहीं खाती तो क्या होता है?
अधिक विशिष्ट विवरणकर्ताओं के साथ अपने पाठ प्रॉम्प्ट को परिष्कृत करने का प्रयास करें, बेहतर गुणवत्ता के लिए अनुमान चरणों की संख्या बढ़ाएं, या ऑडियो की एक नई भिन्नता पाने के लिए एक अलग यादृच्छिक बीज का उपयोग करें।
प्रत्येक जेनरेशन 10 क्रेडिट्स का उपयोग करता है
10 क्रेडिट्स
या 50 क्रेडिट्स 5 जेनेरेशन के लिए
यह मॉडल आपके लिए क्या कर सकता है
ऑडियो उत्पन्न करता है जो आपके अपलोड की गई वीडियो की दृश्य सामग्री और समय से मेल खाता है।
ध्वनि आउटपुट को सादी भाषा का उपयोग करके निर्देशित करता है ताकि आप जो सुनना चाहते हैं उसका सटीक वर्णन कर सकें।
नकारात्मक प्रॉम्प्ट फ़ील्ड में उन्हें सूचीबद्ध करके संगीत या आवाज जैसी अवांछित ध्वनि प्रकार को बाहर करता है।
आउटपुट ऑडियो लंबाई को कुछ सेकंड से सेट करें ताकि आपकी क्लिप की पूरी लंबाई से मेल खाए।
उच्च ऑडियो विश्वस्तता के लिए चरणों की संख्या बढ़ाएं या तेजी से परिणाम के लिए उन्हें कम करें।
एक वीडियो अपलोड करें और बिना किसी पोस्ट-प्रोसेसिंग के एक समाप्त ऑडियो-सिंक्ड फ़ाइल प्राप्त करें।
संशोधन में स्थिरता के लिए समान ऑडियो आउटपुट को पुनः उत्पन्न करने के लिए एक बीज मान को पुनः उपयोग करें।
उच्च गुणवत्ता, संदर्भ-सचेत ऑडियो आउटपुट