Gemini 3.5 Flash ممکن ہے کہ gen AI کے لیے کافی تیز ہو۔

Gemini 3.5 Flash ممکن ہے کہ gen AI کے لیے کافی تیز ہو۔


دوشی کے مطابق، ٹیم نے جیمنی 3.5 فلیش کے ساتھ پری ٹریننگ میں بے شمار بہتری لائی ہے، لیکن بصیرت اس بات سے حاصل ہوئی کہ ڈیویس جیمنی ماڈلز کو کس طرح استعمال کرتے ہیں واقعی نتیجہ خیز ہے۔

دوشی نے کہا، “پوسٹ ٹریننگ کے ساتھ، ہم واقعی صارفین سے حاصل ہونے والے تاثرات کی قدر کو کھولنا شروع کر رہے ہیں، مثال کے طور پر، Antigravity سے،” دوشی نے کہا۔ “واقعی یہی ہے جو آپ کوڈ کی کارکردگی اور ٹول کے استعمال کی کارکردگی کے لحاظ سے دیکھ رہے ہیں۔ اور پھر، امید ہے کہ آپ مرحلہ وار تبدیلی دیکھتے رہیں گے جہاں 3.5 پرو بہتر ہوگا، اور اگلی فلیش اس سیریز کے ساتھ پرو کی کارکردگی کو پورا کرتی ہے۔”

گوگل نئے ماڈل کے ساتھ کوڈ جنریشن پر مرکوز ہے، جو کہ AI کے لیے ایک بنیادی ایجنٹی زاویہ ہے۔ ٹرمینل بنچ اور SWE-Bench Pro دونوں ٹیسٹ کافی بہتری دکھاتے ہیں—3.5 فلیش کلوبرز پرانے فلیش ماڈلز اور جیمنی 3.1 پرو کے مقابلے میں ایک چھوٹی لیکن قابل پیمائش بہتری دکھاتے ہیں۔ اس کے اسکور اسی پڑوس میں ہیں جو OpenAI کے بہت بڑے اور زیادہ مہنگے GPT 5.5 کے ہیں۔

ایجنٹی کام کے بہاؤ میں ایک بڑی رکاوٹ یہ ہے کہ کس طرح تخلیقی ماڈل انسانوں کے لیے بنائے گئے انٹرفیس کو استعمال کر سکتے ہیں۔ دوشی نے کہا کہ اسے حل کرنا آسان مسئلہ نہیں ہے۔ “بعض چیزیں جیسے UI کنٹرول کرنا مہنگا ہے کیونکہ ماڈل کو صفحہ تلاش کرنا ہوتا ہے، اسے یہ جاننا ہوتا ہے کہ کہاں کلک کرنا ہے، اسے متعدد مراحل سے گزرنا پڑتا ہے۔ میرے خیال میں معیار اور قیمت کے اس امتزاج کی وجہ سے Flash ایسا کرنے کے قابل ہے۔”

گوگل کی اے آئی کی تشخیص بھی ان بہتریوں کو ظاہر کرتی ہے۔ گوگل کے بینچ مارکس کے موجودہ مجموعہ میں OSWorld-Verified ہے، جو جانچتا ہے کہ ماڈلز حقیقی کمپیوٹنگ ماحول میں عام کاموں کو کس طرح سنبھالتے ہیں۔ یہ کوڈنگ میں بہتری کی طرح ہے۔ جیمنی 3.5 فلیش کافی حد تک پرانے فلیش ماڈلز کو پیچھے چھوڑتا ہے اور جیمنی 3.1 پرو سے بھی تھوڑا تیز ہے۔ یہ بنیادی طور پر GPT 5.5 کے ساتھ جڑا ہوا ہے۔



گوگل کا نیا فلیش ماڈل ایک بار پھر آخری نسل کے پرو سے تھوڑا بہتر ہے۔

کریڈٹ: گوگل

گوگل کا نیا فلیش ماڈل ایک بار پھر آخری نسل کے پرو سے تھوڑا بہتر ہے۔


کریڈٹ: گوگل

جیمنی 3.5 فلیش کو گوگل میں اندرونی طور پر متعارف کرایا گیا ہے، اور دوشی نے نوٹ کیا کہ اس کا بڑا اثر ہو رہا ہے۔ دوشی نے کہا، “ہمارے پاس داخلی میٹرکس کا ایک سیٹ ہے جس کا ہم جائزہ لے رہے ہیں کہ یہ پیمائش کرتا ہے کہ گوگلرز کیسے کوڈ کرتے ہیں، لہذا ہمارے اپنے کوڈ بیسز کو دیکھتے ہوئے اور ماڈلز اس پر کتنی اچھی کارکردگی کا مظاہرہ کرتے ہیں،” دوشی نے کہا۔ “اور جہاں 3.1 پرو تھا اور جہاں 3.5 فلیش ہے کے درمیان آپ ایک زبردست، بڑے پیمانے پر چھلانگ دیکھ سکتے ہیں۔”



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *