
کیا ہوتا ہے جب آپ AI کوڈنگ ایجنٹس کو روبوٹک ہتھیاروں سے بھری لیب، کچھ کمپیوٹ وسائل، اور روبوٹس کو مختلف کام سکھانے کے لیے “سخاوت مند ٹوکن بجٹ” دیتے ہیں؟ ایجنٹ بظاہر ایک تربیتی طریقہ کار کا پتہ لگا سکتے ہیں جو روبوٹ کو زپ ٹائیز کو کامیابی سے کاٹنا اور یہاں تک کہ مدر بورڈز پر پتلی ساکٹ میں GPUs داخل کرنا سکھاتا ہے۔
روبوٹ کی تربیت کو خودکار کرنے کے لیے AI کس طرح مکمل طور پر خود مختار طریقے سے کام کر سکتا ہے اس کی جھلک ایک نئے ایجنٹ ہارنس فریم ورک کے ذریعے ممکن ہوئی ہے- سافٹ ویئر جو کہ AI ماڈلز کے ارد گرد لپیٹ کر مختلف ٹولز کے استعمال کو قابل بناتا ہے جبکہ میموری، سیاق و سباق، رکاوٹ، اور فیڈ بیک لوپس جیسی صلاحیتیں بھی فراہم کرتا ہے۔ وہ ایجنٹ استعمال، ENPIRE کہا جاتا ہے۔، کو NVIDIA GEAR (جنرلسٹ ایمبوڈیڈ ایجنٹ ریسرچ) لیب میں روبوٹکس کے محققین نے پٹسبرگ کی کارنیگی میلن یونیورسٹی اور یونیورسٹی آف کیلیفورنیا، برکلے کے ساتھیوں کے ساتھ تیار کیا تھا۔
“ہماری NVIDIA GEAR لیب کا ایک حصہ اب راتوں رات انتھک خود کو بہتر بناتا ہے،” NVIDIA میں AI کے ڈائریکٹر جم فین نے لکھا۔ لنکڈ ان پوسٹ. “ہم صرف صبح ہی رپورٹس پڑھتے ہیں۔”
Nvidia کے بانی اور CEO Jensen Huang کے حوالے سے، فین نے مزاحیہ انداز میں اس طرح کے AI ہدایت یافتہ روبوٹ ٹریننگ کے مقصد کو بھی بیان کیا، “ہم سب چھٹی لیتے ہیں اور جینسن کو اس کا نوٹس بھی نہیں ملے گا،”۔ لیکن یہ صرف Nvidia روبوٹکس کے محققین ہی نہیں ہیں جو فائدہ اٹھا سکتے ہیں — فین نے کہا کہ ٹیم ہر چیز کو اوپن سورس کرے گی تاکہ کوئی بھی گھر میں اپنی “خود سے چلنے والی روبوٹ لیب” کی میزبانی کر سکے۔
ENPIRE ہارنس میں چار ماڈیولز ہیں جو AI کوڈنگ ایجنٹوں کو کاموں پر خود کار طریقے سے دوبارہ ترتیب دینے اور تصدیق کرنے کے قابل بناتے ہیں، پالیسیوں کو بہتر بناتے ہیں جو روبوٹک رویے کی رہنمائی کرتے ہیں، متوازی طور پر کام کرنے والے متعدد جسمانی روبوٹس میں ایسی پالیسیوں کا جائزہ لیتے ہیں، اور لاگز کا تجزیہ کرکے، تحقیقی مقالوں کو کھا کر، اور کوڈ کے بنیادی ڈھانچے اور کوڈ کو بہتر بناتے ہیں۔ مزید تکنیکی تفصیلات میں دستیاب ہیں۔ تحقیقی مقالہ 16 جون 2026 کو اپ لوڈ کیا گیا۔
استعمال کا تجربہ تین مختلف AI کوڈنگ ایجنٹوں کے ساتھ کیا گیا، بشمول OpenAI کا Codex with GPT-5.5، Anthropic’s Claude Code with Opus 4.7، اور Moonshot AI کا Kimi Code Kimi K2.6 کے ساتھ۔ کوڈنگ ایجنٹوں کی ٹیموں نے آزادانہ طور پر روبوٹ کی تربیت کے لیے مختلف الگورتھمک نقطہ نظر تیار کیے، انھیں حقیقی دنیا کے تجربات میں آزمایا، اور پھر جو بھی تبدیلیاں خود ہدایت شدہ ٹیسٹنگ کے بار بار چکروں پر کامیابی کی مجموعی شرح کو بڑھانے میں مدد کرتی ہیں اسے برقرار رکھا۔

