• شعار Picasso IA
    Logo Picasso IA
  • الرئيسية
  • صورة ذكاء اصطناعي
    Nano Banana 2
  • فيديو ذكاء اصطناعي
    Veo 3.1 Lite
  • دردشة ذكاء اصطناعي
    Gemini 3 Pro
  • تحرير الصور
  • تحسين الصورة
  • إزالة الخلفية
  • تحويل النص إلى كلام
  • التأثيرات
    NEW
  • التوليدات
  • الفواتير
  • الدعم
  • الحساب
  1. مجموعة
  2. تحويل النص إلى فيديو
  3. Kling Avatar V2

حول أي وجه إلى فيديو مع Kling Avatar v2

يأخذ Kling Avatar v2 صورة مرجعية واحدة وملف صوتي وينتج فيديو قصير حيث يتحدث الوجه بتزامن مع الصوت. يتعامل النموذج مع العمل المعقد لمطابقة حركات الفم والتعبيرات الدقيقة وحركة الرأس مع كلماتك المسجلة، لذا تحصل على نتيجة مقنعة دون لمس محرر الجدول الزمني. يقبل مجموعة واسعة من أنواع الصور، من الصور الشخصية عالية الجودة إلى الشخصيات المرسومة بخط اليد والرموز الكرتونية وصور الحيوانات. يمكنك إضافة موجه نصي لتحديد مزاج الأفتار أو الإيماءات أو الإطار الكاميرا، مما يمنحك تحكماً إضافياً في المظهر النهائي. يتيح لك نمطا الإخراج المختلفان المقابلة بين السرعة والجودة حسب موعد التسليم. بالنسبة لأي شخص ينتج محتوى على نطاق واسع، يزيل Kling Avatar v2 الاختناق المتمثل في تسجيل مقدمي البرامج أمام الكاميرا أو توظيف الممثلين الصوتيين لمطابقة الفيديو. أسقط صوتك واختر صورتك وستحصل على شخصية متحدثة مصقولة جاهزة للتضمين في عرض تقديمي أو فيديو قصير الشكل أو دورة رقمية في دقائق.

رسمي

Kwaivgi

4.6k تشغيل

Kling Avatar V2

2026-02-03

الاستخدام التجاري

جدول المحتويات

  • نظرة عامة
  • كيف يعمل
  • الأسئلة الشائعة
  • تكلفة الأرصدة
  • الميزات
  • حالات الاستخدام
  • أمثلة
احصل على Nano Banana Pro

نظرة عامة

يأخذ Kling Avatar v2 صورة ثابتة وملف صوتي ويحولهما إلى فيديو أفتار متحدث مع مزامنة شفاه دقيقة وحركة وجه طبيعية. على Picasso IA، يمكنك تشغيل هذا باستخدام صورة شخصية أو شخصية كرتونية أو صورة حيوان أو أي عمل فني مصمم، والنموذج يطابق حركات الفم والتعبيرات الدقيقة مع صوتك تلقائياً. لا توجد حاجة لشاشة خضراء أو معدات التقاط الحركة أو برامج التحرير الاحترافية. يتيح لك موجه نصي تحديد مزاج الشخصية أو زاوية الكاميرا قبل الإنشاء، مما يمنحك تحكماً إضافياً في النتيجة النهائية. إنه يناسب أي سير عمل محتوى تحتاج فيه إلى شخصية متحدثة دون تكلفة جلسة فيديو.

كيف يعمل

  • حمّل صورتك المرجعية (JPG أو PNG، بطول لا يقل عن 300 بكسل على أقصر جانب، مع نسبة عرض إلى ارتفاع بين 1:2.5 و 2.5:1).
  • حمّل ملف صوتك بصيغة MP3 أو WAV أو M4A أو AAC، بحجم يصل إلى 5MB.
  • اختياري اكتب موجه نصي يصف مشاعر الأفتار أو الإجراءات أو إطار الكاميرا المفضل.
  • حدد وضع Standard للإخراج الأسرع أو وضع Pro للدقة البصرية الأعلى.
  • أرسل المهمة وحمّل فيديو الأفتار المتحدث المنتهي عندما يكون جاهزاً.

الأسئلة الشائعة

هل أحتاج إلى مهارات البرمجة أو المعرفة التقنية لاستخدام هذا؟ لا، فقط افتح Kling Avatar v2 على Picasso IA وأضبط الإعدادات التي تريدها واضغط على إنشاء.

هل يمكن تجربته مجاناً؟ نعم، يمكنك تشغيل فيديو الأفتار الأول دون إدخال بيانات الدفع. تحقق من صفحة الأرصدة على Picasso IA للحدود المجانية الحالية وما يتضمنه كل خطة.

كم من الوقت يستغرق الحصول على النتائج؟ يستغرق وضع Standard عادة أقل من دقيقة بالنسبة لمقاطع صوتية قصيرة. يستغرق وضع Pro وقتاً أطول ولكنه ينتج تفاصيل وجه أحدث وحركة أكثر سلاسة في جميع أنحاء الفيديو.

ما تنسيقات الإخراج المدعومة؟ يُرجع النموذج ملف فيديو يمكنك تحميله مباشرة. يطابق طول الإخراج طول ملف الصوت الذي قدمته، لذا ينتج تسجيل مدته 15 ثانية فيديو بطول 15 ثانية.

هل يمكنني استخدام أي صورة كمرجع أفتار؟ يجب أن تكون الصورة JPG أو PNG، بطول لا يقل عن 300 بكسل على أقصر جانب، وضمن نسبة عرض إلى ارتفاع 1:2.5 إلى 2.5:1. يجب أن تكون الوجوه مرئية بوضوح وموضوعة بإضاءة جيدة للحصول على أفضل نتائج مزامنة الشفاه.

ماذا يحدث إذا لم تبدو النتيجة صحيحة؟ حاول تعديل الموجه النصي ليكون أكثر تحديداً بشأن التعبير أو موضع الرأس، أو استخدم صورة مرجعية أنظف مع إضاءة أفضل وزاوية أكثر أماماً. يميل التبديل إلى وضع Pro أيضاً إلى تقليل العيوب على الصور المعقدة.

أين يمكنني استخدام ملفات الفيديو الناتجة؟ الملف المُنزل خاص بك للاستخدام في العروض التقديمية أو المنشورات الاجتماعية أو الدورات الرقمية أو ملاعب العملاء أو أي سياق آخر. لا توجد قيود على منصة الإخراج.

تكلفة الأرصدة

تختلف تكلفة الأرصدة لهذا النموذج بناءً على الإعدادات التي تختارها. فيما يلي التكاليف حسب التكوين:

التكوينأرصدة
std1.2لكل ثانية
pro2.2لكل ثانية

الميزات

كل ما يمكن لهذا النموذج فعله من أجلك

دقة مزامنة الشفاه

تطابق حركات فم الأفتار والوجه مسار الصوت إطاراً تلو الآخر.

دعم شخصيات متعددة

حرّك البشر الواقعيين أو الشخصيات الكرتونية أو الحيوانات أو الفنون المصممة من صورة واحدة.

مرونة صيغة الصوت

يقبل ملفات MP3 و WAV و M4A و AAC بحجم يصل إلى 5MB للتحميل السهل من أي جهاز.

أوضاع Standard و Pro

اختر إنشاء Standard أسرع أو إخراج Pro بأعلى جودة حسب احتياجك.

التعبير المدفوع بالموجه

أضف موجه نصي لتشكيل مشاعر الأفتار والإيماءات وحركات الكاميرا.

بدون علامات مائية

حمّل مقاطع الفيديو المنتهية جاهزة للنشر أو التضمين أو المشاركة مع العملاء.

حالات الاستخدام

حمّل صورة شخصية وتسجيل تعليق صوتي لإنتاج مقدم متزامن الشفاه لعرض تقديمي للأعمال

حول رسم توضيحي لشخصية كرتونية إلى ناطق متحرك بإقرانه بنص مسجل

أنشئ رسالة فيديو شخصية حيث يتحدث أفتار مختار بكلماتك الدقيقة من مقطع صوتي سجلته

قم بتحريك شخصية حيوان لإلقاء إعلان العلامة التجارية مع كلام متزامن وحركة وجه طبيعية

اصنع مقطع وسائط اجتماعية قصيراً حيث يقرأ أفتار مصمم عرضاً ترويجياً بصوتك الخاص

قم بإنشاء فيديو توضيحي مع مضيف بشري افتراضي دون توظيف موهبة أمام الكاميرا أو استئجار استوديو

أنشئ مقدماً افتراضياً لدورة عبر الإنترنت بتحريك شخصية مختارة لمطابقة السرد المسجل مسبقاً

أمثلة

Audio
3m 47s
Mode: pro

a beauty blogger talking

Audio
2m 49s
Mode: std

a beauty blogger talking

تبديل الفئة

تأثيرات

تحويل النص إلى صورة

تحويل النص إلى صورة

تحويل النص إلى فيديو

نماذج اللغة الكبيرة

نماذج اللغة الكبيرة

تحويل النص إلى كلام

تحويل النص إلى كلام

دقة فائقة

دقة فائقة

مزامنة الشفاه

توليد الموسيقى بالذكاء الاصطناعي

توليد الموسيقى بالذكاء الاصطناعي

تحرير الفيديو

تحويل الكلام إلى نص

تحويل الكلام إلى نص

تحسين الفيديو بالذكاء الاصطناعي

إزالة الخلفية

إزالة الخلفية