اپل خانواده مدلهای هوش مصنوعی OpenELM را برای وظایف دستگاههای کوچک منتشر میکند: همه چیزهایی که باید بدانید
تلاشهای هوش مصنوعی اپل حداقل کند بوده است، مخصوصاً وقتی آن را با توسعه سریعی که در رقبای آن، یعنی مایکروسافت و گوگل اتفاق میافتد، مقایسه کنید. در حالی که شرکتهایی مانند سامسونگ، گوگل و حتی Nothing دارای ویژگیهای هوش مصنوعی فراوانی در دستگاههای مربوطه خود هستند، آیفون در حال کنار گذاشته شدن است زیرا اپل در رقابت هوش مصنوعی پیشروی میکند. با این حال، این شرکت فعالانه در تلاش است تا نفوذ کند و اخیرا با شرکت هایی مانند گوگل و OpenAI در مورد معامله احتمالی که به مدل های هوش مصنوعی آنها اجازه می دهد در آیفون استفاده شود، مذاکره کرده است، اما این هنوز در حال انجام است.
اکنون، محققان اپل خانوادهای متشکل از چهار مدل سبکوزن هوش مصنوعی را در کتابخانه مدل Hugging Face منتشر کردهاند که میتوانند بر روی یک دستگاه اجرا شوند و به استفاده آینده آنها در دستگاههایی مانند آیفون، آیپد و مک اشاره میکنند.
اپل چهار مدل AI منبع باز منتشر کرد
با توجه به پست Hugging Face، خانواده مدلهای هوش مصنوعی با نام «مدلهای زبان کارآمد منبع باز» یا OpenELM شناخته میشوند. این مدل ها به گونه ای طراحی شده اند که کارهای کوچک را به طور موثر انجام دهند، مانند نوشتن ایمیل. اپل میگوید OpenELM با استفاده از کتابخانه CoreNet که شامل RefinedWeb، deduplicated PILE، زیرمجموعه RedPajama و زیرمجموعه Dolma v1.6 است، روی مجموعههای داده در دسترس عموم با استفاده از کتابخانه CoreNet آموزش دیده است که در مجموع حدود 1.8 تریلیون توکن است. با چهار پارامتر – 70 میلیون، 450 میلیون، 1.1 میلیارد و 3 میلیارد پارامتر راه اندازی شد.
برای افراد ناآشنا، پارامترها معیاری هستند از تعداد متغیرهایی که یک مدل هوش مصنوعی هنگام تصمیم گیری می تواند از آنها یاد بگیرد. آنها بر اساس مجموعه داده هایی هستند که مدل هوش مصنوعی بر اساس آن آموزش داده شده است.
به گفته اپل، خانواده مدلهای هوش مصنوعی OpenELM برای «توانمندسازی و غنیسازی جامعه تحقیقاتی باز با فراهم کردن دسترسی به مدلهای زبانی پیشرفته» منتشر شد.
فشار هوش مصنوعی اپل
سازنده آیفون مدتی است که هوش مصنوعی را آزمایش کرده است. سال گذشته یک چارچوب یادگیری ماشینی به نام MLX منتشر کرد که به مدلهای هوش مصنوعی این امکان را میدهد تا در دستگاههای مجهز به سیلیکون اپل عملکرد بهتری داشته باشند. همچنین یک ابزار تصویربرداری به نام MLLM-Guided Image Editing یا MGIE راه اندازی کرد.
ماه گذشته فاش شد که محققان اپل در زمینه آموزش مدلهای هوش مصنوعی بر روی متن و تصویر به پیشرفتهایی دست یافتهاند. یک مقاله تحقیقاتی در مورد آن در 14 مارس منتشر شد. با عنوان «MM1: روشها، تجزیه و تحلیل و بینشهای پیشآموزش چندوجهی LLM»، نشان میدهد که چگونه استفاده از معماریهای دادههای متعدد و مدلهای آموزشی میتواند به دستیابی به نتایج پیشرفته در چندین معیار کمک کند.
همچنین گفته میشود که بر روی مدل زبان بزرگ خود (LLM) بر اساس چارچوب جدیدی به نام Ajax کار میکند که میتواند برنامهای شبیه به ChatGPT به نام «Apple GPT» ارائه دهد. گفته می شود که همکاری بین بخش های مختلف اپل، مانند مهندسی نرم افزار، یادگیری ماشین و مهندسی ابر، در حال انجام است تا این پروژه LLM به واقعیت تبدیل شود.
عرضه مدلهای هوش مصنوعی خانواده OpenELM مطمئناً تصویر جالبی از توسعه هوش مصنوعی در اپل ارائه میکند. با این حال، با توجه به اینکه هنوز هیچ مدل اصلی عرضه نشده است، مدتی است تا دستگاه های اپل مانند آیفون و مک بالاخره بتوانند از آن بهره ببرند.