اینتھروپک کا کہنا ہے کہ یہ عنوانات اتنے خطرناک ہیں کہ اس کے Fable 5 ماڈل کے بارے میں بات کرنے دیں۔

اینتھروپک منگل Claude Fable 5 کو عوامی طور پر جاری کیا گیا۔اس کا پہلا “Mythos-class” ماڈل جس کے بارے میں اس کا کہنا ہے کہ مجموعی صلاحیتوں میں اس کے پچھلے فرنٹیئر Opus ماڈلز کو پیچھے چھوڑ دیا ہے۔ لیکن آج ماڈل کا آغاز ان حفاظتی اقدامات کے ساتھ آتا ہے جو اسے سائبرسیکیوریٹی، حیاتیات اور کیمسٹری جیسے موضوعات پر سوالات کے جوابات دینے سے روکنے کے لیے بنائے گئے ہیں، جہاں کمپنی نے عوامی طور پر اس کے ممکنہ اثرات کے بارے میں فکر مند بدنیتی پر مبنی اداکاروں کو “ترقی” دینا۔

انتھروپک کا کہنا ہے کہ افسانہ 5 “اسی بنیادی ماڈل” پر کام کرتا ہے جیسا کہ Mythos 5، جو باہر آ رہا ہے اس کا مہینوں طویل “میتھوس پیش نظارہ” کا دورانیہ آج، لیکن صرف “سائبر ڈیفنڈرز کے ایک چھوٹے سے گروپ” کے لیے قابل اعتماد فیصلہ کیا گیا ہے۔ موجودہ پروجیکٹ گلاس ونگ. Mythos 5 کے برعکس، اگرچہ، عوامی طور پر قابل رسائی Fable 5 کو پہلے کے Claude Opus 4.8 ماڈل سے متعلق مخصوص حساس موضوعات پر سوالات کرنے اور ایسا ہونے پر صارف کو خبردار کرنے کے لیے ڈیزائن کیا گیا ہے۔

Fable 5 کے لیے بہت سے دعوی کردہ بینچ مارک بہتریوں میں، سائبر سیکیورٹی سے متعلق ایک خاص طور پر بڑی چھلانگ تھی۔

کریڈٹ:

بشری

اینتھروپک نے کہا کہ اس نے ان حفاظتی اقدامات کو “مثالی سے زیادہ سخت” قرار دیا ہے، جس کا مطلب ہے کہ نظام کبھی کبھار “بے ضرر درخواستوں” کو اس طرح سے مسترد کر سکتا ہے کہ یہ تسلیم کرتا ہے کہ یہ باقاعدہ صارفین کے لیے مایوس کن ہو سکتا ہے۔ لیکن اینتھروپک کا کہنا ہے کہ اس طرح کے جھوٹے مثبت نتائج ٹیسٹنگ کے تمام سیشنوں میں سے پانچ فیصد سے بھی کم میں سامنے آتے ہیں، اور یہ ایسے حالات سے بچنے کے لیے قابل تھا جہاں Mythos بدنیتی پر مبنی اداکاروں کو “سنگین نقصان پہنچانے میں مدد دے سکتا ہے جو انہیں دوسرے ذرائع سے نہیں مل سکتا تھا۔”

میں آپ کو ایسا کرنے نہیں دے سکتا، ڈیو

Fable 5 کے موضوع پر مبنی حفاظتی اقدامات ارد گرد بنائے گئے ہیں۔ درجہ بندی کا ایک نظام ممنوعہ فوری مضامین کے ساتھ ساتھ جیل توڑنے کی ممکنہ کوششوں کا وسیع پیمانے پر پتہ لگانے کے لیے ڈیزائن کیا گیا ہے۔ بگ باؤنٹی پروگرام کے ساتھ 1,000 گھنٹے سے زیادہ ریڈ ٹیم ٹیسٹنگ میں، اینتھروپک کا کہنا ہے کہ بیرونی ٹیمیں Fable 5 کے لیے کوئی بھی یونیورسل جیل بریک تلاش کرنے میں ناکام رہیں۔ نئے ماڈل نے خودکار جیل بریک کی کوششوں کو پچھلے کلاڈ اوپس ماڈلز سے کہیں زیادہ حد تک مزاحمت کی، اینتھروپک نے کہا۔

کمپنی نے کہا کہ وہ خاص طور پر Mythos 5 کی “ایجنٹک ہیکنگ” کو انجام دینے کی صلاحیت کے بارے میں فکر مند ہے، جو پہلے کے ماڈلز کے مقابلے میں بہت زیادہ سہولت کے ساتھ ملٹی پارٹ سائبر حملوں کو انجام دیتا ہے۔ لیکن حالیہ مہینوں میں برطانیہ کے AI سیکیورٹی انسٹی ٹیوٹ کی جانچ سے پتہ چلا کہ Mythos Preview OpenAI کے GPT-5.5 کی طرح کارکردگی کا مظاہرہ کیا۔ کیپچر دی فلیگ چیلنجز کے ایک سوٹ پر، یہ تجویز کرتا ہے کہ میتھوس کی کارکردگی “ایک ماڈل کے لیے مخصوص پیش رفت نہیں ہے۔”

Source link

میں آپ کو ایسا کرنے نہیں دے سکتا، ڈیو

About Urdu Soch Team

Leave a Reply Cancel reply

میں آپ کو ایسا کرنے نہیں دے سکتا، ڈیو

Related Posts

کامن ویلتھ فیوژن اپنے 400 میگاواٹ ری ایکٹر کے لیے فزکس کیس بناتا ہے۔

تین اہم اہم علامات شہر کی “شہری نبض” بناتے ہیں۔

محقق کے ساتھ گرما گرم دشمنی میں بند، مائیکروسافٹ نے ان کے انکشاف کردہ 0 دن کا تعین کیا۔

About Urdu Soch Team

Leave a Reply Cancel reply