يأخذ MMAudio فيديو صامتًا أو هادئًا وينتج صوتًا مطابقًا من الصفر، مما يوفر عليك ساعات من البحث عن مؤثرات صوتية أو العمل مع محررات الصوت. سواء كنت منشئ محتوى يحاول جعل مقطع يبدو حقيقيًا أو محرر فيديو يحتاج إلى صوت محيط سريع، فإن هذا النموذج يقرأ المحتوى البصري وينشئ صوتًا يناسب المشهد. النموذج يقبل موجه نصي إلى جانب الفيديو الخاص بك، حتى تتمكن من توجيه الإخراج نحو أصوات محددة مثل أوراق الشجر وحركة المرور في المدينة أو همسة الحشد. يسمح لك الموجه السلبي باستبعاد أنواع الأصوات غير المرغوبة، مثل الموسيقى، مما يبقي النتيجة مركزة على نسيج الصوت الدقيق الذي تحتاجه. يمكنك ضبط المدة وخطوات الاستدلال لتحقيق التوازن بين الجودة وسرعة الإنشاء. يندرج MMAudio في المرحلة اللاحقة للإنتاج دون الحاجة إلى برنامج صوت أو خبرة تقنية. حمّل مقطعك، واكتب وصفًا موجزًا للمشهد الصوتي الذي تريده، وحمّل ملف فيديو مع صوت متزامن جاهز للتحرير أو النشر. يتوفر مجانًا على Picasso IA، لذا يمكن لإنشاؤك الأول أن يحدث في غضون دقائق.
ينشئ MMAudio صوتًا متزامنًا من محتوى الفيديو باستخدام الذكاء الاصطناعي، حيث يحل أحد أكثر الأجزاء المستهلكة للوقت في مرحلة ما بعد إنتاج الفيديو: العثور على الصوت أو إنشاء صوت يناسب الشاشة فعلاً. على Picasso IA، تحمّل مقطع صامتًا أو منخفض الصوت، وتصف الأصوات التي تريدها، والنموذج ينشئ صوتًا يطابق السياق البصري. يمكن لصانع أفلام يضيف صوت المطر المحيط لمشهد خارجي، أو منشئ وسائط اجتماعية يحتاج إلى أصوات خطوات دقيقة لفيديو الطبخ، أو رسام كاريكاتير يريد همسة ماكينة ناعمة لعرض تقني، استخدامها دون أي برنامج صوت. النتيجة هي ملف فيديو قابل للتنزيل مع الصوت المُنشأ مدمجًا بالفعل وجاهزًا للاستخدام.
هل أحتاج إلى مهارات البرمجة أو المعرفة التقنية لاستخدام هذا؟ لا، فقط افتح MMAudio على Picasso IA وضبط الإعدادات التي تريدها واضغط على إنشاء.
هل MMAudio مجاني للمحاولة؟ نعم، يمكنك تشغيل النموذج مجانًا على Picasso IA دون التسجيل. قد يتم تطبيق الأرصدة على الأجيال الأطول أو ذات الجودة الأعلى.
ما المدة التي يستغرقها الحصول على النتائج؟ تنتهي معظم الأجيال في أقل من دقيقة للمقاطع حتى 8 ثواني. قد تستغرق المقاطع الأطول أو عدد خطوات الاستدلال الأعلى وقتًا أطول قليلاً.
ما صيغة الإخراج التي يعيدها MMAudio؟ النموذج يعيد ملف فيديو مع الصوت المُنشأ مدمجًا بالفعل، وجاهز للتنزيل والإفلات في خط الزمن للتحرير.
هل يمكنني تخصيص نمط الصوت أو المحتوى؟ نعم. الموجه النصي يسمح لك بوصف أي بيئة صوتية بلغة عادية، والموجه السلبي يسمح لك باستبعاد أنواع صوت محددة مثل الموسيقى أو الأصوات. يتحكم إعداد قوة CFG في مدى اتباع الإخراج لموجهك.
ماذا يحدث إذا لم يطابق الصوت المُنشأ الفيديو بشكل جيد؟ حاول تحسين موجه النص الخاص بك بوصفات أكثر تحديدًا، وزيادة عدد خطوات الاستدلال لجودة أفضل، أو استخدام بذرة عشوائية مختلفة للحصول على اختلاف جديد من الصوت.
كل ما يمكن لهذا النموذج فعله من أجلك
ينشئ صوتًا يطابق المحتوى البصري وتوقيت الفيديو المحمّل.
وجه إخراج الصوت باستخدام اللغة العادية لوصف بالضبط ما تريد سماعه.
استبعد أنواع الصوت غير المرغوبة مثل الموسيقى أو الأصوات بإدراجها في حقل الموجه السلبي.
اضبط طول الإخراج الصوتي من بضع ثواني وحتى مطابقة الطول الكامل للمقطع.
زيادة عدد الخطوات للحصول على دقة صوت أعلى أو تقليلها للحصول على نتائج أسرع.
حمّل فيديو واحصل على ملف مع صوت متزامن دون أي معالجة لاحقة.
أعد استخدام قيمة البذرة لإعادة إنشاء نفس الإخراج الصوتي للاتساق عبر المراجعات.
إخراج صوتي عالي الجودة وواعي للسياق