خوبی ها و بدی های آینده هوش مصنوعی آیفون اپل
چندی پیش، شایعه شده بود که اپل به صورت داخلی بر روی چیزی به نام Apple GPT کار می کند، یک ربات چت مبتنی بر مدل هوش مصنوعی خود شرکت با هدف تقلید از کاری که ChatGPT OpenAI انجام می دهد. در ماههای بعد، شاهد بودیم که محصولات هوش مصنوعی مولد در همه جا ظاهر میشوند، از Google Pixels و گوشیهای Galaxy S24 سامسونگ گرفته تا گوشیهای پیشرو مانند Nothing Phone 2a.
در همین حال، تمام آنچه از اپل دریافت کردیم، ادعاهای مبهم اما جسورانه بود. تیم کوک، مدیر عامل اپل به سرمایه گذاران گفت که تلاش مولد هوش مصنوعی اپل زمانی که اواخر سال جاری میلادی وارد بازار شود، زمینه جدیدی را ایجاد خواهد کرد. با این حال، به نظر می رسد اپل برای تحقق بخشیدن به این رویاها از گوگل کمک خواهد گرفت. یا شاید حتی OpenAI به کمک بیاید.
طبق گزارش بلومبرگ، اپل در حال مذاکره با گوگل برای مجوز ساخت مدل های هوش مصنوعی Gemini برای آیفون است. این به نظر همان استراتژی ای است که سامسونگ برای گوشی های سری گلکسی اس 24 دنبال کرد، که می توانند مدل Gemini Nano گوگل را اجرا کنند، در حالی که نسخه های قدرتمندتر در فضای ابری موجود هستند.
شرایط این قرارداد هنوز نهایی نشده است زیرا گفته می شود که بحث ها بسیار در حال انجام است. با این حال، ظاهرا اپل نیز در حال مذاکره با OpenAI است. به یاد بیاورید که فناوری اصلی OpenAI، مانند مدل GPT-4 و Dall-E، در حال حاضر در مجموعه محصولات مایکروسافت و از طریق برنامه ها و خدمات مستقل مانند ChatGPT Plus در دسترس است. این یک پیشرفت جالب در جاهطلبیهای هوش مصنوعی اپل است – و من را به همان اندازه هیجان زده و نگران میکند.
سفر هوش مصنوعی اپل (تا کنون)
در آخرین ماه سال 2023، بدون سر و صدای زیاد، اپل مجموعه ای از کتابخانه ها و چارچوب های مدل را در گروه MLX معرفی کرد که برای اجرا بر روی سیلیکون اختصاصی آنها طراحی شده بودند. این حرکت در آستانه معرفی قابلیتهای هوش مصنوعی مولد به سری مک است، مشابه تلاشهای کوالکام با پلتفرم Snapdragon X Elite.
در اوایل سال جاری، بخش تحقیقات اپل مقالهای را در مورد یک ابزار هوش مصنوعی مولد به نام Keyframer منتشر کرد که به کاربران امکان میداد محتوای متحرک بسازند. این عمدتا بر اساس مدل GPT-4 از OpenAI است، اما شامل گرافیک برداری برای پردازش تصاویر ثابت است.
علاوه بر این، کارشناسان اپل همچنین یک مقاله تحقیقاتی را ارائه کردند که در آن ابزار هوش مصنوعی را توصیف می کند که ویرایش تصویر را از طریق دستورالعمل های شفاهی ساده تسهیل می کند. این ویژگی شبیه جعبه ابزار ویرایش چندرسانه ای با کمک صوتی است که توسط آخرین تراشه های پرچمدار اسنپدراگون کوالکام تبلیغ می شود.
گزارش بعدی بلومبرگ نشان داد که اپل در حال افزایش تیم اختصاصی خود برای تحقیق در مورد عملکردهای هوش مصنوعی مولد است، با هدف بزرگ در دسترس قرار دادن این ابزارها تا سال 2024 برای توسعه دهندگان.
شایعه شده است که اولین سری از عملکردهای هوش مصنوعی مولد اپل با iOS 18 که قرار است در ماه ژوئن عرضه شود، عرضه خواهد شد. اما بر اساس آخرین گزارش بلومبرگ، این ویژگیها به جای امکانات AI مولد که معمولاً به ابر متصل هستند، مانند مواردی که توسط ChatGPT، Gemini یا Perplexity ارائه میشوند، سیستمهای خود دستگاه را هدف قرار میدهند.
در سپتامبر، The Information فاش کرد که اپل در حال توسعه “مدل های اصلی” با هدف بهبود سیری است. این ابتکار قرار است شبیه به پیشرفت Gemini در Google Assistant باشد.
جمینی در آیفون چه کاری می تواند انجام دهد؟
Gemini اکنون قابلیت های زیادی را در حین کار به صورت محلی و اتصال به اینترنت برای گوشی به ارمغان می آورد. هنگامی که روی دستگاه اجرا میشود، مانند Google Pixel 8 Pro، میتواند مکالمات را در برنامه Recorder خلاصه کند، حتی زمانی که تلفن آفلاین است.
برای افرادی که با برنامه صفحه کلید Gboard کار می کنند، Gemini Nano Smart Reply را با برنامه هایی مانند WhatsApp شروع می کند. به طور خلاصه، مکالمه شما را می خواند و بر این اساس پاسخ هایی را بر اساس زمینه پیشنهاد می کند. هوش مصنوعی دستگاه همچنین ترجمههای آفلاین را اضافه میکند، قابلیتی که در حال حاضر در گوشیهای سری Galaxy S24 سامسونگ آماده Gemini ارائه شده است.
در حال حاضر با نصب اپلیکیشن Gemini بر روی گوشی می تواند کارهای زیر را انجام دهد.
- درست مانند Google Assistant یا ChatGPT، میتوانید با Gemini در مکالمات به زبان طبیعی شرکت کنید و در نوشتن، طوفان فکری و غیره کمک بگیرید.
- پس از فعال کردن پسوند Workspace، به سرعت اطلاعات موجود در ایمیل ها یا فایل های خود را خلاصه کنید. اطلاعات را می توان در قالب هایی مانند لیست ها، نمودارها و جداول خلاصه کرد.
- تصاویر را با استفاده از اعلان های متنی مانند موتور Dall-E OpenAI ایجاد کنید.
- برای استفاده از دوربین خود به روش های جدید کمک بگیرید. در برنامه Gemini، دوربین را به سمت یک صحنه بگیرید و از هوش مصنوعی اطلاعاتی در مورد اشیاء موجود در کادر بخواهید.
- ببینید چه چیزی روی صفحه نمایش شما است. جمینی را با دستور «Hey Google» احضار کنید تا کار را انجام دهید. به عنوان مثال، می تواند مقاله ای را که در حال حاضر می خوانید خلاصه کند.
- از Google Maps و Google Flights برای برنامه ریزی سفرها و حتی ایجاد روال های شخصی استفاده کنید.
معامله هوش مصنوعی اپل و گوگل چگونه می تواند انجام شود
همانطور که در بالا ذکر شد، سامسونگ در حال همکاری نزدیک با گوگل است تا مدل Gemini Nano AI را روی گوشی های پرچمدار خود کار کند. اما Gemini به پرچمداران محدود نمی شود. در فوریه امسال، مدیاتک اعلام کرد که سیلیکون میان رده Dimensity 8300 در کنار پرچمدار Dimensity 9300 برای Google Gemini بهینه شده است.
انجام چنین کاری برای اپل نباید خیلی سخت باشد. اگر قرارداد صدور مجوز دستگاه با شکست مواجه شود، همیشه یک مسیر برنامه وجود دارد. مشخص نیست که اپل چه استراتژی را دنبال می کند، با این فرض که معامله در وهله اول انجام می شود.
سوال بزرگتر این است که آیا قرارداد مجوز جمینی به طور معناداری نحوه تعامل مصرف کنندگان با آیفون خود را تغییر می دهد یا خیر. و مهمتر از آن، آیا Gemini هر گونه تغییری را برای سیری تشویق می کند؟ به بیان صریح، سیری هنوز راه درازی در پیش دارد تا بتواند به دستیار گوگل برسد.
اما حتی گوگل هم متوجه نشده که Gemini کجا وجود دارد یا به طور کامل جایگزین Google Assistant شده است. در حال حاضر وقتی Gemini را روی گوشی اندرویدی نصب می کنید، جایگزین دستیار گوگل می شود. یا حداقل تلاش می کند.
تلفن شما همچنان برای گستره وسیعی از کارهای پیش پا افتاده اما معنادار مانند برقراری تماس، تنظیم زنگ هشدار، ارسال پیام، کنترل دستگاههای خانه هوشمند، و ایجاد ورودیهای تقویم، به دستیار Google وابسته است. به همین ترتیب، برای ناوبری، ورودی صوتی در Gboard و Android Auto، Google Assistant همچنان هوش مصنوعی قابل اعتماد است، نه Gemini.
علاوه بر این، دستیار Google هنوز هم همراه مورد علاقه هوش مصنوعی در نمایشگرهای هوشمند Wear OS و ساعتهای هوشمند است. با توجه به اینکه اپل چقدر نرمافزار خود را به اکوسیستم سختافزاری، بهویژه بین آیفون و اپل واچ متصل میکند، یک رویکرد مرحلهای که در آن Gemini، Google Assistant و/یا Siri فقط برخی از مسئولیتها را بر عهده میگیرند، سردرگمی زیادی برای میانگین ایجاد میکند. کاربر.
از طرف دیگر، اپل میتواند از نزدیک با Google همکاری کند و ادغامهای انحصاری ایجاد کند، و Gemini را به ویژگیهای اکوسیستم اپل مانند سیری، ایمیل، یادداشتها، سافاری، تقویم، سلامت و موارد دیگر مرتبط کند. با این حال، با توجه به وضعیت فعلی سیاستهای حفظ دادههای Gemini، ما برای چنین ادغام فشرده در سطح سیستم نفس خود را حبس نمیکنیم.
خطرات Gemini برای اپل
البته اپل موج اول هوش مصنوعی مولد را در گوشیهای هوشمند از دست داد و اگر گزارشها را باور کرد، این شرکت دیوانهوار در تلاش است تا به عقبنشینی برسد. اما قرارداد مجوز جمینی همچنین به این معنی است که ممکن است هرگز شاهد کار خود اپل با توسعه هوش مصنوعی مولد تحت پروژه Ajax نباشیم. یا شاید ما فقط آن را به شکل رقیقشده ببینیم در حالی که Gemini کارهای سنگین هوش مصنوعی را در آیفون انجام میدهد.
اما جوزاها بدون عیب نیستند. برعکس، بیش از هر ابزار اصلی مولد هوش مصنوعی دیگری شکست خورده است. چند هفته پیش، کاربران Gemini متوجه شدند که این دستگاه تصاویر بسیار نادرستی، به ویژه در استفاده نادرست از رنگ پوست، قومیت، و دقت تاریخی تولید میکند.
این بحث تا جایی بالا گرفت که گوگل ساخت متن به تصویر را برای جمینی متوقف کرد. ساندار پیچای، مدیرعامل گوگل در یادداشتی داخلی که توسط NPR گزارش شده است، نوشت: «برای روشن بودن، این کاملا غیرقابل قبول است و ما اشتباه کردیم.
در آن سوی اقیانوس اطلس، زمانی که اظهارات وی در مورد نخست وزیر هند، نارندرا، تحقیرآمیز تلقی شد و در رسانه های اجتماعی منتشر شد، جمینی درگیر جنجال دیگری شد. راجیو چاندراسخار، وزیر اتحادیه هند (از طریق NDTV ) هشدار داد: «به سادگی گفتن «… متاسفم، آزمایش نشد» با انتظارات ما در مورد انطباق با قانون مطابقت ندارد.
این جنجال بار دیگر مقررات هوش مصنوعی را وارد بحث کرده است، و همچنین توصیه ای به بازیگران اصلی هوش مصنوعی صادر شده است که از آنها می خواهد قبل از انتشار عمومی ابزارهایی مانند Gemini، تأیید صریح را دریافت کنند.
برای شرکتی که به اندازه اپل با مقررات دولتی ایمن است، صدور مجوز Gemini برای صدها میلیون دستگاه در سراسر جهان خطر کمی نیست. به خصوص زمانی که خود گوگل هشدار می دهد که «جمینی اشتباه خواهد کرد» و می گوید که همیشه باید نادرستی را دوباره بررسی کنید.
توصیه های سردبیران