Llama Guard 4 12B एक मल्टीमोडल AI सुरक्षा मॉडल है, जिसे पाठ और छवियों को सुरक्षित या असुरक्षित के रूप में वर्गीकृत करने के लिए बनाया गया है। सामग्री निर्माता, प्लेटफ़ॉर्म मालिक, और उपयोगकर्ता-जनित सामग्री की समीक्षा करने वाली टीमें किसी भी इनपुट को इससे चला सकती हैं और एक स्पष्ट निर्णय के साथ-साथ, यदि कोई हानि श्रेणी पाई जाती है, तो विशिष्ट हानि श्रेणी भी प्राप्त कर सकती हैं। यह सामग्री समीक्षा से अनुमान लगाने की ज़रूरत को हटाता है और आपको कुछ ही सेकंड में एक दोहराने योग्य, सुसंगत जाँच देता है। यह मॉडल पाठ और छवियों, दोनों को संभालता है, और हिंसा, घृणा भाषण, यौन सामग्री, तथा खतरनाक निर्देशों सहित हानि श्रेणियों के एक व्यापक सेट के विरुद्ध स्कैन करता है। आप एक system prompt पास करके यह परिभाषित कर सकते हैं कि मॉडल कितना सख्त होना चाहिए, और आउटपुट की परिवर्तनशीलता नियंत्रित करने के लिए temperature और sampling सेटिंग्स समायोजित कर सकते हैं। हर परिणाम एक label के साथ वापस आता है जो बताता है कि सामग्री सुरक्षित है या उसने किस policy category का उल्लंघन किया है। व्यवहार में, Llama Guard 4 12B बिना किसी रुकावट के किसी भी सामग्री समीक्षा workflow में जुड़ जाता है। एक टिप्पणी पेस्ट करें, एक screenshot अपलोड करें, या किसी दस्तावेज़ से एक पैराग्राफ दें, और एक सेकंड से भी कम समय में सुरक्षा निर्णय प्राप्त करें। कोई configuration files नहीं, कोई code setup नहीं, बस इसे Picasso IA पर खोलें और अपनी पहली जाँच चलाएँ।
Llama Guard 4 12B एक सामग्री सुरक्षा classifier है जो पाठ या पाठ-सहित-छवि इनपुट पढ़ता है और एक स्पष्ट सुरक्षित या असुरक्षित निर्णय लौटाता है, साथ ही उस विशिष्ट policy category को भी बताता है जिसने फ़्लैग को ट्रिगर किया। यदि आप कोई प्लेटफ़ॉर्म चलाते हैं, AI-संचालित टूल बनाते हैं, या उपयोगकर्ता सबमिशन का moderation करते हैं, तो यह भरोसेमंद दूसरा मत पाना कि सामग्री सीमा पार करती है या नहीं, मैन्युअल रूप से करने पर धीमा और महँगा होता है। Picasso IA पर, Llama Guard 4 12B यह समीक्षा स्वचालित रूप से करता है और कुछ ही सेकंड में संरचित निर्णय लौटाता है। यह घृणा भाषण, आत्म-हानि सामग्री, और ग्राफ़िक हिंसा जैसी चीज़ों की जाँच करता है, ताकि आपकी टीम हर चीज़ को शुरुआत से जाँचने के बजाय स्पष्ट संकेतों पर कार्य कर सके।
क्या इसे उपयोग करने के लिए मुझे programming कौशल या तकनीकी ज्ञान चाहिए? नहीं, बस Picasso IA पर Llama Guard 4 12B खोलें, अपनी इच्छित सेटिंग्स समायोजित करें, और generate पर क्लिक करें।
Llama Guard 4 12B वास्तव में क्या output करता है? यह एक classification verdict लौटाता है: या तो "safe" या "unsafe." जब सामग्री फ़्लैग होती है, तो यह विशिष्ट violation category भी लौटाता है, ताकि आपको ठीक-ठीक पता हो कि कौन सा नियम ट्रिगर हुआ और आप उसी अनुसार प्रतिक्रिया दे सकें। इससे आउटपुट केवल द्विआधारी होने के बजाय कार्यात्मक बन जाता है।
क्या मैं पाठ के साथ-साथ छवियाँ भी जाँच सकता हूँ? हाँ। मॉडल आपके text prompt के साथ images की एक सूची स्वीकार करता है, जिससे आप एक ही अनुरोध में multimodal सामग्री का मूल्यांकन कर सकते हैं। यह उन प्लेटफ़ॉर्मों के लिए उपयोगी है जहाँ उपयोगकर्ता एक साथ लिखित सामग्री और दृश्य संलग्नक दोनों पोस्ट करते हैं।
मैं यह कैसे अनुकूलित करूँ कि मॉडल कौन से नियम लागू करे? आप एक system prompt प्रदान करते हैं जो उस policy का वर्णन करता है जिसे मॉडल को लागू करना चाहिए। आप देखने योग्य विशिष्ट श्रेणियों का नाम दे सकते हैं, सख्ती स्तर निर्धारित कर सकते हैं, या अपने समुदाय या प्लेटफ़ॉर्म से संबंधित कोई भी कस्टम दिशानिर्देश जोड़ सकते हैं।
एक वर्गीकरण में कितना समय लगता है? अधिकांश अनुरोध कुछ ही सेकंड में निर्णय लौटाते हैं। प्रसंस्करण समय इनपुट पाठ की लंबाई और शामिल छवियों की संख्या पर निर्भर करता है, लेकिन छोटे text-only इनपुट आमतौर पर सबसे तेज़ होते हैं।
यदि मैं वर्गीकरण परिणाम से असहमत हूँ तो क्या होता है? आप अपने system prompt में मानदंडों को परिष्कृत कर सकते हैं और अनुरोध को फिर से चला सकते हैं। policy विवरण को पुनः शब्दबद्ध करना या violation thresholds को समायोजित करना अक्सर सीमा-रेखा वाले मामलों को आपकी अपेक्षा की दिशा में मोड़ देता है। Picasso IA आपको usage caps से टकराए बिना जितनी बार चाहें उतनी बार iterate करने देता है।
मैं आउटपुट का उपयोग कहाँ कर सकता हूँ? निर्णय और category label plain text हैं, इसलिए आप उन्हें spreadsheet में पेस्ट कर सकते हैं, review queue में भेज सकते हैं, या उन्हें किसी automated content pipeline के अगले चरण के input के रूप में उपयोग कर सकते हैं।
यह मॉडल आपके लिए क्या कर सकता है
एकीकृत सुरक्षा जाँचों के लिए एक ही अनुरोध में पाठ और छवियों, दोनों को स्वीकार करता है।
असुरक्षित सामग्री का पता चलने पर केवल एक द्विआधारी फ़्लैग नहीं, बल्कि विशिष्ट policy category लौटाता है।
अपने उपयोग-केस के लिए मॉडल की सख्ती को समायोजित करने हेतु अपने स्वयं के सुरक्षा मानदंड परिभाषित करें।
निर्णयों को अधिक निर्धारक या अधिक विविध बनाने के लिए 0 से 2 के बीच sampling temperature सेट करें।
बिना किसी infrastructure setup की आवश्यकता के कुछ ही सेकंड में सुरक्षित या असुरक्षित परिणाम देता है।
मॉडल के आउटपुट में दोहराव कम करने के लिए presence और frequency penalties समायोजित करें।
परिणामों को संक्षिप्त और सुरक्षा निर्णय पर केंद्रित रखने के लिए completion length सीमित करें।