Gemma 4 12B تقریباً اتنا ہی قابل ہے جتنا کہ 26 بلین پیرامیٹرز والا ورژن۔
کریڈٹ: گوگل
گوگل کا کہنا ہے کہ نیا ماڈل پیچیدہ ملٹی اسٹپ استدلال اور ایجنٹ ورک فلو کے قابل ہے جس کے لیے پہلے بڑے جیما ویریئنٹس کی ضرورت تھی۔ چھوٹے پیرامیٹر کی گنتی کے باوجود، Gemma 4 12B نئے وضع کردہ کے ساتھ آتا ہے۔ ملٹی ٹوکن پیشن گوئی (MTP) ڈرافٹرز، جو مستقبل کے ممکنہ ٹوکن کا حساب لگانے کے لیے غیر استعمال شدہ پروسیسنگ سائیکلوں کا فائدہ اٹھاتے ہیں۔ نتیجہ زیادہ رفتار اور کارکردگی ہے. گوگل نے دوسرے Gemma 4 ماڈلز کے اختیاری MTP ورژن جاری کیے ہیں، لیکن یہ پہلا ورژن ہے جس میں MTP باکس سے باہر ہے۔
Gemma 4 12B ملٹی موڈیلٹی کے لیے ایک نئے نقطہ نظر کی بدولت بھی زیادہ موثر ہے۔ Gemma 4 خاندان مقامی طور پر ملٹی موڈل ہے، متن، آڈیو، یا تصاویر کو بطور ان پٹ قبول کرتا ہے۔ زیادہ تر gen AI ماڈلز—بشمول Gemma 4 ویریئنٹس—غیر ٹیکسٹ ان پٹس پر کارروائی کرنے اور اس ڈیٹا کو LLM کو منتقل کرنے کے لیے وقف شدہ انکوڈرز کا استعمال کرتے ہیں۔ یہ کافی اچھی طرح سے کام کرتا ہے، لیکن یہ تاخیر اور میموری کے استعمال کو بڑھاتا ہے۔
نئے وسط وزن والے ماڈل کے ساتھ، گوگل نے وژن کے لیے ایک ہموار ایمبیڈنگ ماڈیول نافذ کیا ہے، جس میں سنگل میٹرکس ضرب اور پوزیشنی ایمبیڈنگ شامل ہے، جو ڈیٹا کو مناسب مقامی بیداری کے ساتھ LLM تک منتقل کرنے کی اجازت دیتا ہے۔ یہ ایک بڑے مڈل مین انکوڈر کی ضرورت کو ختم کرتا ہے۔ آڈیو کے لیے، کوئی انکوڈنگ نہیں ہے۔ ڈویلپرز نے خام آڈیو سگنل کو ٹیکسٹ ٹوکن کے لیے استعمال ہونے والے ویکٹرز میں پیش کرنے کا ایک طریقہ تیار کیا۔
اگر آپ نئے Gemma 4 ماڈل کو دیکھنا چاہتے ہیں، تو یہ ٹولز کے ذریعے ڈاؤن لوڈ کیے بغیر قابل رسائی ہے۔ ایل ایم اسٹوڈیو, گوگل اے آئی ایج گیلری، اور مزید۔ لیکن Gemma 4 12B کے ساتھ پورا خیال یہ ہے کہ آپ اسے مقامی طور پر اور اپنی شرائط پر چلا سکتے ہیں۔ اگر آپ کے پاس RAM ہے تو، ماڈل کے وزن فوری طور پر ڈاؤن لوڈ کے لیے دستیاب ہیں۔ کاگل اور گلے ملنے والا چہرہ. یہ صرف 18GB کی شرمیلی ہے۔


