گوگل دو مدل جدید هوش مصنوعی توسط LLM Gemma به خانواده خود اضافه می کند – چرا مهم است
در ماه فوریه، گوگل از Gemma، خانواده مدلهای زبان سبک سبک وزن (LLM) خود برای توسعهدهندگان متن باز استفاده کرد. محققان در Google DeepMind آن را با هدف کمک به توسعه دهندگان و محققان در ساخت هوش مصنوعی به روشی مسئولانه توسعه دادند. قبلاً دو مورد جدید اضافه شده به Gemma – CodeGemma و RecurrentGemma را اعلام کرده است. Google DeepMind با این اقدام قصد دارد در رقابت هوش مصنوعی (AI) که با رقابت OpenAI و مایکروسافت مواجه است، همگام شود.
همچنین بخوانید: Google Gemini AI Image Disaster – واقعاً چه اتفاقی برای تولید کننده تصویر افتاد؟
اگرچه این شرکت بر سر برخی از قابلیتهای هوش مصنوعی محبوبترین مدل هوش مصنوعی خود، جمینی، در آب داغی قرار گرفته است، به نظر نمیرسد که این بحث و جدل سرعت پژوهشگران را کند نکرده باشد. این مدلهای جدید هوش مصنوعی فرصتهای نوآوری را برای توسعهدهندگان یادگیری ماشین (ML) نوید میدهند. همه چیز را در مورد دو مدل جدید Gemma AI – CodeGemma و Recurrent Gemma بیاموزید.
Google CodeGemma
اولین مدل از دو مدل جدید هوش مصنوعی CodeGemma است، یک مدل سبک وزن با قابلیت کدنویسی و پیروی از دستورالعمل ها. موجود در سه نوع:
1. 7B نوع از پیش آموزش دیده برای تکمیل و وظایف تولید کد
2. نوع 7B با راهاندازی راهنما برای پیروی از دستورالعملها و گپ زدن با کدها.
3. گزینه 2B از پیش آموزش دیده برای تکمیل سریع کد در رایانه های محلی.
گوگل می گوید که CodeGemma نه تنها می تواند خطوط و توابع ایجاد کند، بلکه حتی می تواند بلوک هایی از کد ایجاد کند، چه به صورت محلی در رایانه ها یا از طریق منابع ابری استفاده شوند. این چند زبانه است، به این معنی که می توانید از آن به عنوان دستیار هنگام کدنویسی در زبان هایی مانند پایتون، جاوا اسکریپت و جاوا استفاده کنید. کد تولید شده توسط CodeGemma نه تنها از نظر نحوی صحیح است، بلکه از نظر معنایی نیز صحیح است. این نویدبخش کاهش خطاها و زمان رفع اشکال است.
همچنین بخوانید: درباره Gemma – خانواده Google LLM همه چیز را بیاموزید
این مدل جدید هوش مصنوعی بر روی 500 میلیارد توکن داده که بیشتر به زبان انگلیسی است، آموزش داده شده است، از جمله کدهای موجود در مخازن عمومی، ریاضیات و اسناد در وب.
Google Recurrent Gemma
مدل هوش مصنوعی دیگر که RecurrentGemma نام دارد، با استفاده از شبکههای عصبی مکرر و توجه محلی، عملکرد حافظه را بهبود میبخشد. بنابراین، برای آزمایشات تحقیقاتی در نظر گرفته شده است. RecurrentGemma در حالی که عملکرد معیار مشابهی با مدل AI Gemma 2B DeepMind ارائه میکند، معماری منحصربهفردی دارد که به آن اجازه میدهد سه فونت ارائه دهد – کاهش مصرف حافظه، توان عملیاتی بالاتر و نوآوری اکتشافی.
همچنین بخوانید: اپل در حال مذاکره با گوگل برای مجوز Gemini برای ویژگی های هوش مصنوعی آیفون است
به گفته گوگل، RecurrentGemma میتواند نمونههای طولانیتری را حتی در دستگاههای دارای محدودیت حافظه به دلیل نیاز به حافظه کمتر تولید کند. این همچنین به مدل هوش مصنوعی اجازه می دهد تا استنتاج هایی را در دسته های بزرگ انجام دهد و توکن ها را در هر ثانیه افزایش دهد. گوگل همچنین میگوید که مدلهای مبتنی بر ترانسفورماتور مانند Gemma میتوانند با طولانیتر شدن توالیها، سرعت خود را کاهش دهند. از سوی دیگر، RecurrentGemma نرخ نمونه برداری خود را بدون توجه به طول دنباله حفظ می کند.
گوگل می گوید که در حال نمایش “مدلی بدون ترانسفورماتور است که به عملکرد بالایی دست می یابد و پیشرفت ها در تحقیقات یادگیری عمیق را برجسته می کند.”
یک چیز دیگر! ما اکنون در کانال های واتس اپ هستیم! ما را در آنجا دنبال کنید تا هیچ به روز رسانی دنیای فناوری را از دست ندهید. برای دنبال کردن کانال HT Tech WhatsApp کلیک کنید اینجا برای پیوستن در حال حاضر!