اینتھروپک منگل Claude Fable 5 کو عوامی طور پر جاری کیا گیا۔اس کا پہلا “Mythos-class” ماڈل جس کے بارے میں اس کا کہنا ہے کہ مجموعی صلاحیتوں میں اس کے پچھلے فرنٹیئر Opus ماڈلز کو پیچھے چھوڑ دیا ہے۔ لیکن آج ماڈل کا آغاز ان حفاظتی اقدامات کے ساتھ آتا ہے جو اسے سائبرسیکیوریٹی، حیاتیات اور کیمسٹری جیسے موضوعات پر سوالات کے جوابات دینے سے روکنے کے لیے بنائے گئے ہیں، جہاں کمپنی نے عوامی طور پر اس کے ممکنہ اثرات کے بارے میں فکر مند بدنیتی پر مبنی اداکاروں کو “ترقی” دینا۔
انتھروپک کا کہنا ہے کہ افسانہ 5 “اسی بنیادی ماڈل” پر کام کرتا ہے جیسا کہ Mythos 5، جو باہر آ رہا ہے اس کا مہینوں طویل “میتھوس پیش نظارہ” کا دورانیہ آج، لیکن صرف “سائبر ڈیفنڈرز کے ایک چھوٹے سے گروپ” کے لیے قابل اعتماد فیصلہ کیا گیا ہے۔ موجودہ پروجیکٹ گلاس ونگ. Mythos 5 کے برعکس، اگرچہ، عوامی طور پر قابل رسائی Fable 5 کو پہلے کے Claude Opus 4.8 ماڈل سے متعلق مخصوص حساس موضوعات پر سوالات کرنے اور ایسا ہونے پر صارف کو خبردار کرنے کے لیے ڈیزائن کیا گیا ہے۔
اینتھروپک نے کہا کہ اس نے ان حفاظتی اقدامات کو “مثالی سے زیادہ سخت” قرار دیا ہے، جس کا مطلب ہے کہ نظام کبھی کبھار “بے ضرر درخواستوں” کو اس طرح سے مسترد کر سکتا ہے کہ یہ تسلیم کرتا ہے کہ یہ باقاعدہ صارفین کے لیے مایوس کن ہو سکتا ہے۔ لیکن اینتھروپک کا کہنا ہے کہ اس طرح کے جھوٹے مثبت نتائج ٹیسٹنگ کے تمام سیشنوں میں سے پانچ فیصد سے بھی کم میں سامنے آتے ہیں، اور یہ ایسے حالات سے بچنے کے لیے قابل تھا جہاں Mythos بدنیتی پر مبنی اداکاروں کو “سنگین نقصان پہنچانے میں مدد دے سکتا ہے جو انہیں دوسرے ذرائع سے نہیں مل سکتا تھا۔”
میں آپ کو ایسا کرنے نہیں دے سکتا، ڈیو
Fable 5 کے موضوع پر مبنی حفاظتی اقدامات ارد گرد بنائے گئے ہیں۔ درجہ بندی کا ایک نظام ممنوعہ فوری مضامین کے ساتھ ساتھ جیل توڑنے کی ممکنہ کوششوں کا وسیع پیمانے پر پتہ لگانے کے لیے ڈیزائن کیا گیا ہے۔ بگ باؤنٹی پروگرام کے ساتھ 1,000 گھنٹے سے زیادہ ریڈ ٹیم ٹیسٹنگ میں، اینتھروپک کا کہنا ہے کہ بیرونی ٹیمیں Fable 5 کے لیے کوئی بھی یونیورسل جیل بریک تلاش کرنے میں ناکام رہیں۔ نئے ماڈل نے خودکار جیل بریک کی کوششوں کو پچھلے کلاڈ اوپس ماڈلز سے کہیں زیادہ حد تک مزاحمت کی، اینتھروپک نے کہا۔
کمپنی نے کہا کہ وہ خاص طور پر Mythos 5 کی “ایجنٹک ہیکنگ” کو انجام دینے کی صلاحیت کے بارے میں فکر مند ہے، جو پہلے کے ماڈلز کے مقابلے میں بہت زیادہ سہولت کے ساتھ ملٹی پارٹ سائبر حملوں کو انجام دیتا ہے۔ لیکن حالیہ مہینوں میں برطانیہ کے AI سیکیورٹی انسٹی ٹیوٹ کی جانچ سے پتہ چلا کہ Mythos Preview OpenAI کے GPT-5.5 کی طرح کارکردگی کا مظاہرہ کیا۔ کیپچر دی فلیگ چیلنجز کے ایک سوٹ پر، یہ تجویز کرتا ہے کہ میتھوس کی کارکردگی “ایک ماڈل کے لیے مخصوص پیش رفت نہیں ہے۔”


