Llama Guard 4 12B هو نموذج أمان متعدد الوسائط للذكاء الاصطناعي صُمم لتصنيف النصوص والصور على أنها آمنة أو غير آمنة. يمكن لمنشئي المحتوى، وأصحاب المنصات، والفرق التي تراجع المحتوى الذي ينشئه المستخدمون تمرير أي جزء من المدخلات عبره والحصول على حكم واضح، بالإضافة إلى فئة الضرر المحددة إذا تم اكتشاف واحدة. إنه يزيل التخمين من مراجعة المحتوى ويمنحك فحصًا متسقًا وقابلًا للتكرار في ثوانٍ. يتعامل النموذج مع النصوص والصور معًا، ويفحصها مقابل مجموعة واسعة من فئات الضرر التي تشمل العنف، وخطاب الكراهية، والمحتوى الجنسي، والتعليمات الخطيرة. يمكنك تمرير system prompt لتحديد مدى صرامة النموذج، وضبط temperature وإعدادات العيّنة للتحكم في تباين المخرجات. تأتي كل نتيجة مع تصنيف يوضح ما إذا كان المحتوى آمنًا، أو أي فئة سياسات انتهكها. عمليًا، يندمج Llama Guard 4 12B في أي سير عمل لمراجعة المحتوى بسلاسة. الصق تعليقًا، أو ارفع لقطة شاشة، أو أرسل فقرة من مستند، واحصل على حكم أمان في أقل من ثانية. لا ملفات إعدادات، ولا تجهيز برمجي، فقط افتحه على Picasso IA وابدأ أول فحص لك.
Llama Guard 4 12B هو مصنّف لسلامة المحتوى يقرأ النصوص أو المدخلات النصية مع الصور ويعيد حكمًا واضحًا آمن أو غير آمن، إلى جانب فئة السياسة المحددة التي تسببت في وضع العلامة. إذا كنت تدير منصة، أو تبني أدوات مدعومة بالذكاء الاصطناعي، أو تراجع مشاركات المستخدمين، فإن الحصول على رأي ثانٍ موثوق بشأن ما إذا كان المحتوى يتجاوز الحد هو أمر بطيء ومكلف عندما يُنجز يدويًا. على Picasso IA، يتولى Llama Guard 4 12B هذه المراجعة تلقائيًا، ويعيد أحكامًا منظمة في ثوانٍ. إنه يتحقق من أمور مثل خطاب الكراهية، ومحتوى إيذاء النفس، والعنف الدموي، بحيث يمكن لفريقك التصرف بناءً على إشارات واضحة بدلًا من مراجعة كل شيء من الصفر.
هل أحتاج إلى مهارات برمجة أو معرفة تقنية لاستخدام هذا؟ لا، فقط افتح Llama Guard 4 12B على Picasso IA، واضبط الإعدادات التي تريدها، ثم اضغط generate.
ماذا يُخرج Llama Guard 4 12B فعليًا؟ إنه يعيد حكم تصنيف: إما "safe" أو "unsafe." وعندما يتم تمييز المحتوى، فإنه يعيد أيضًا فئة الانتهاك المحددة، حتى تعرف بالضبط أي قاعدة تم تفعيلها ويمكنك الرد وفقًا لذلك. هذا يجعل المخرج قابلًا للتنفيذ بدلًا من أن يكون ثنائيًا فقط.
هل يمكنني فحص الصور بالإضافة إلى النص؟ نعم. يقبل النموذج قائمة من الصور إلى جانب prompt النصي الخاص بك، مما يتيح لك تقييم المحتوى متعدد الوسائط في طلب واحد. هذا مفيد للمنصات التي ينشر فيها المستخدمون محتوى مكتوبًا ومرفقات مرئية في الوقت نفسه.
كيف أخصص القواعد التي يطبقها النموذج؟ تقدم system prompt يصف السياسة التي يجب أن يطبقها النموذج. يمكنك تسمية فئات محددة للمراقبة، أو تحديد مستوى الصرامة، أو إضافة أي إرشادات مخصصة ذات صلة بمجتمعك أو منصتك.
كم يستغرق التصنيف؟ تعود معظم الطلبات بحكم خلال بضع ثوانٍ. يعتمد وقت المعالجة على طول النص المدخل وعدد الصور المضمنة، لكن المدخلات النصية القصيرة فقط تكون عادة الأسرع.
ماذا يحدث إذا اختلفت مع نتيجة التصنيف؟ يمكنك تنقيح المعايير في system prompt وإعادة تشغيل الطلب. غالبًا ما يؤدي إعادة صياغة وصف السياسة أو تعديل حدود الانتهاك إلى تغيير الحالات الحدية في الاتجاه الذي تتوقعه. يتيح لك Picasso IA التكرار مرات عديدة كما تحتاج دون الوصول إلى حدود الاستخدام.
أين يمكنني استخدام المخرجات؟ الحكم وتصنيف الفئة هما نص عادي، لذا يمكنك لصقهما في جدول بيانات، أو تمريرهما إلى قائمة مراجعة، أو استخدامهما كمدخل لخطوة أخرى في خط أنابيب محتوى آلي.
كل ما يمكن لهذا النموذج فعله من أجلك
يقبل النصوص والصور في الطلب نفسه لفحوصات أمان موحدة.
يعرض فئة السياسة المحددة عند اكتشاف محتوى غير آمن، وليس مجرد مؤشر ثنائي.
حدّد معايير الأمان الخاصة بك لضبط مدى صرامة النموذج حسب حالة الاستخدام لديك.
اضبط درجة العيّنة من 0 إلى 2 لجعل الأحكام أكثر حتمية أو أكثر تنوعًا.
يقدّم نتيجة آمن أو غير آمن في ثوانٍ دون الحاجة إلى إعداد بنية تحتية.
اضبط presence وfrequency penalties لتقليل التكرار في مخرجات النموذج.
حدّ من طول الإكمال للحفاظ على النتائج موجزة ومركزة على حكم الأمان.