در مورد ویژگی های هوش مصنوعی سامسونگ گلکسی اس 24 خیلی هیجان زده نشوید
“عصر جدیدی از هوش مصنوعی موبایل.” اینگونه است که سامسونگ از سری گوشی های هوشمند سری گلکسی اس 24 آینده خود تبلیغ می کند. برای رویداد Unpacked خود در اواخر این ماه، این شرکت نوید یک تجربه کاملاً جدید تلفن همراه با هوش مصنوعی را داده است.
سامسونگ اولین نامی نخواهد بود که انگشتان پای خود را در هجوم هوش مصنوعی که توسط شرکت هایی مانند ChatGPT و Midjourney برانگیخته شده است، فرو می برد. دو نیروگاه سیلیکونی گوشیهای هوشمند – کوالکام و مدیاتک – اخیراً نمایش عظیمی از قابلیتهای هوش مصنوعی جدیدترین پردازندههای پرچمدار و میانرده خود را به نمایش گذاشتهاند.
تغییر آشکار است. هوش مصنوعی کلیدواژه بازاریابی گوشی ها خواهد بود. اما دقیقا چه چیزی در انتظار ماست؟ اینکه چگونه این به اصطلاح “دستاوردهای هوش مصنوعی” ارزش معنی داری را به آنها اضافه می کند یک راز باقی مانده است. یا شاید این فقط یک ترفند موجود است که در انتظار بسته بندی مجدد با نام یا برنامه بومی دیگر است.
سامسونگ می تواند کالا را تحویل دهد یا به طرز چشمگیری شکست بخورد
بیایید با گوشی های سری گلکسی اس 24 شروع کنیم. آنها با تراشه اسنپدراگون 8 نسل 3 کوالکام عرضه خواهند شد. این سازنده تراشه ادعاهای جسورانه ای در مورد قابلیت های هوش مصنوعی مولد چیپست جدید خود دارد. به عنوان مثال، گفته میشود که با استفاده از فناوری هوش مصنوعی انتشار پایدار در عرض یک ثانیه تصویری را از پیامهای متنی تولید میکند.
کوالکام توضیح فنی شگفت انگیزی در مورد چگونگی بهینه سازی فناوری انتشار پایدار برای عملکرد دستگاه ارائه کرده است. رقیب مدیاتک همچنین ادعا میکند که بخشهای هوش مصنوعی داخلی پرچمدار Dimensity 9300 به لطف Stable Diffusion، تولید متن به تصویر را در کمتر از یک ثانیه امکانپذیر میکند.
در حال حاضر، ما در حال حاضر یک گوشی مجهز به آخرین پرچمدار کوالکام داریم. دستگاه مورد بحث iQoo 12 است، اما جالب است بدانید که در مواد بازاریابی گوشی به هیچ ترفند هوش مصنوعی مولد، به ویژه آنهایی که توسط Qualcomm و MediaTek تبلیغ می شود، اشاره نشده است.
با این تصاویر گربههای نینجا که با هوش مصنوعی تولید شدهاند چه باید کرد؟
بیایید فرض کنیم سامسونگ کسی است که قرار است این قابلیت تولید متن به تصویر را ارائه دهد. در پایان روز چه کاری انجام خواهد داد؟ ما در حال حاضر نمی دانیم که آیا ترفند تبدیل متن به تصویر در یک برنامه شخص ثالث گنجانده خواهد شد یا اینکه سامسونگ آن را در یکی از برنامه های خود ادغام خواهد کرد.
سوال اصلی این است که چقدر به الگوهای استفاده روزانه از گوشی هوشمند ما اضافه می کند. خریدار متوسط گلکسی اس 24 با تصاویری که با یک خط پیام متنی تولید می شود چه خواهد کرد؟ شاید آنها از این تصاویر تولید شده توسط هوش مصنوعی برای افزودن مقداری چاشنی به چت ها یا ایجاد سر و صدا در رسانه های اجتماعی استفاده کنند.
اما در اینجا هنوز مقداری اصطکاک وجود دارد. شما باید این تصاویر را از یک خط متن تولید کنید، آنها را به صورت محلی ذخیره کنید (یا مستقیماً آنها را در کلیپ بورد کپی کنید)، و سپس این تصاویر هوش مصنوعی را در برنامه چت مورد نظر خود قرار دهید. بهینه ترین راه حل این است که سامسونگ به نحوی ترفند تولید تصویر به متن را مستقیماً در صفحه کلید ادغام کند.
باز هم، چرا وقتی شکلکها، گیفها و استیکرها میتوانند این کار را انجام دهند، همه مشکلات را پشت سر بگذاریم؟ همچنین، خروجی 512 x 512 پیکسل وضوح کافی برای قرار دادن این تصاویر تولید شده توسط هوش مصنوعی در یک تکلیف دانشگاهی یا ارائه کاری نیست.
همچنین، سیستم احتمالا رایگان نخواهد بود. ویدئوی آزمایشی مدیاتک اشاره می کند که یک گزینه Premium روی میز است. خریداران Galaxy S24 زمانی که به تعداد مشخصی خروجی رسیدند، ممکن است به سادگی به محدودیت رمز تبدیل متن به تصویر برسند، سپس یا به سطح سرعت تولید تصویر کندتر تنزل دهند یا از آنها خواسته شود که هزینه اشتراک بپردازند.
اما اگر این واقعیت باشد، پس کل موضوع بحث برانگیز است زیرا ما در حال حاضر راه حل هایی مانند Dall-E OpenAI را داریم. میتوانید آن را برای تولید تصویر رایگان دریافت کنید یا برای ChatGPT Plus بپردازید تا از مزایای تولید سریعتر و دقیقتر تصویر با آخرین مدل Dall-E 3 لذت ببرید. این تنها یکی از بسیاری از تولیدکنندگان متن به تصویر است.
کوالکام می گوید اسنپدراگون 8 نسل 3 “اولین مدلی است که از مدل های هوش مصنوعی نسل چند وجهی پشتیبانی می کند.” این بدان معنی است که یک ربات چت (بر اساس مدل متا لاما) که به صورت بومی روی تلفن اجرا می شود، ورودی را به صورت متن و تصویر و همچنین صدا می پذیرد. باز هم، این منحصر به فرد نیست، زیرا ChatGPT-4 در حال حاضر این قابلیت را ارائه می دهد، البته در پشت دیوار اشتراک.
آیا واقعاً به آن نیاز داریم؟
یکی از امیدوار کننده ترین ویژگی های کوالکام که تبلیغ می کند، تقویت تصویر با هوش مصنوعی است. اساساً، میتوانید بوم تصویر را در هر جهتی که میخواهید گسترش دهید، و هوش مصنوعی تولیدکننده دستگاه، پیکسلها را بهطور هوشمند بر اساس پیام متنی شما تولید میکند و اشیاء بیشتری را به قاب اصلی اضافه میکند.
دیدن این ترفند شگفتانگیز است – دیدن اینکه چگونه با اضافه شدن اشیاء بیشتر و گسترش افق، تصویر منبسط میشود، گویی یک هنرمند استاد کار خود را روتوش کرده است. اما نمیخواهید این کار را با عکسهایی که روی گوشی خود کلیک میکنید تا به عنوان خاطره نگه دارید، انجام دهید. استفاده از تقویت هوش مصنوعی بر روی آنها مانند آلوده کردن خاطرات شما با تصاویر و سناریوهای جعلی است که هرگز تجربه نکرده اید.
تعمیم یک شرط بزرگ دیگر برای پیاده سازی هوش مصنوعی مولد در تلفن های دستگاه است. این برای خواندن اخبار و اطلاع از آخرین پیشرفت ها در حوزه های مختلف عالی است. با این حال، این ترفند تنها در صورتی برجسته می شود که حداقل اصطکاک وجود داشته باشد. به عنوان مثال، اگر کاربران بتوانند به جای باز کردن یک برنامه دیگر، یک مقاله خبری را در همان صفحه مرورگر خلاصه کنند.
اگر این مورد دومی است، چرا به برنامهای که قبلاً این کار را میکند تغییر ندهید؟ به عنوان مثال، Artifact یک برنامه خیره کننده طراحی شده توسط کوین سیستروم، یکی از بنیانگذاران اینستاگرام است که از هوش مصنوعی برای خلاصه کردن مقالات برای شما استفاده می کند.
اکنون اپلیکیشنها و وبسایتهایی وجود دارند که اخبار را به صورت خلاصهای از جمله Inshorts ارائه میکنند. برای صندوق ورودی شما، Shortwave یک برنامه عالی است که می تواند بدون هزینه اضافی بیشتر از خلاصه کردن زنجیره های ایمیل برای شما انجام دهد.
هوش مصنوعی مولد دستگاه همچنین ترفندهایی مانند ویرایش عکس مبتنی بر صدا را نوید می دهد. بسیار راحت به نظر میرسد، اما تصور اینکه وقتی فیلترهای تک لمسی و لغزندههای دانهدار جریان ویرایش چندرسانهای به همان اندازه سریع و مفیدتر را در تلفنها ارائه میدهند، سخت است تصور کنید که چقدر به زندگی ما میافزاید.
در مرحله بعد، بیایید به وضعیت نان و کره استفاده از هوش مصنوعی بپردازیم تا فقط چند چت کلی داشته باشیم یا پاسخ هایی دریافت کنیم که در غیر این صورت به تحقیقات مبتنی بر اینترنت نیاز دارند. دوباره با مشکلات کیفی مواجه خواهیم شد.
مدلهای هوش مصنوعی مولد که به صورت بومی روی تلفنها اجرا میشوند – مانند Meta's Llama – به دلیل در دسترس بودن منابع اساسی، پیشرفتهترین در نوع خود نیستند. بیشتر از گوگل نگاه نکنید. Pixel 8 Pro فقط با کوچکترین مدل های زبان بزرگ گوگل به نام Gemini Nano کار می کند. چرا از طریق برنامههای موبایل اختصاصی آنها به جای اکتفا به مدل زبانی کمتر توانا، به چیزی مانند ChatGPT یا Pi تغییر نمیدهید؟
جایی که هوش مصنوعی مولد واقعاً باید باشد
در حال حاضر، من می بینم که هوش مصنوعی مولد بهترین ترفند خود را در جدا کردن وظایف تلفن هوشمند از فضای ابری (و ملزم به آنلاین بودن همیشه) و ارائه ایمنی بیشتر انجام می دهد. اما برای انجام این کار، آن ترفندهای هوش مصنوعی روی دستگاه باید به عنوان دستیار، تا حدودی مانند Google Assistant، Alexa، یا Siri، عمل کنند.
یا بهتر از آن، آنها باید بخشی از دستیار شوند. به دستیار هوش مصنوعی خود بگویید که همه تصاویر گربه را از کتابخانه شما بگیرد، آنها را در یک کلاژ ببافد و برای پدرتان بفرستد. یا از او بخواهید بهترین برنامه سفر را برای یک سفر یک روزه به دیزنی لند برنامه ریزی کند، ارزان ترین بلیط را برای آخر هفته آینده برای شما بیابد و همه آن جزئیات را در تقویم گوگل ترتیب دهد.
همچنین، اگر ابزار تولید کننده هوش مصنوعی روی دستگاه دیگر داده های شما را به سرورهای ابری ارسال نمی کند و هر عملیاتی را در گوشی هوشمند شما محلی نگه می دارد، دلیلی برای نگرانی در مورد حفظ حریم خصوصی داده ها وجود ندارد. حداقل در تئوری اینطور است. تا کنون، من در مورد چشم انداز Galaxy AI که سامسونگ می فروشد مطمئن نیستم، اما جالب است که ببینیم آیا سامسونگ واقعاً می تواند تجربیات هوش مصنوعی مولد معناداری را ارائه دهد یا فقط یک دسته از ترفندهای به سختی عملی برای ترفندها ارائه دهد.
توصیه های سردبیران