همه چیز در Google I/O 2024 اعلام شد
Android، Wear OS و Pixel ممکن است نامهای شناختهشده گوگل باشند، اما این Google Gemini، فناوری هوش مصنوعی نوظهور آن بود که در Google I/O 2024 توجهات را به خود جلب کرد. جشن نرمافزار سالانه این شرکت هر چیزی را که شرکت در سال آینده برنامهریزی کرده است، آغاز میکند. امسال، ساندار پیچای، مدیر عامل شرکت، به صراحت اعلام کرد که گوگل در «عصر جمینی» خود قرار دارد. از جستجوهای هوش مصنوعی در Google Photos گرفته تا دستیاران مجازی هوش مصنوعی که در کنار شما کار خواهند کرد، گوگل جمینی را در همه چیز گنجانده است و پیامدهای آن بسیار زیاد است. در اینجا مروری بر همه چیزهایی است که گوگل امسال اعلام کرد.
تصاحب جوزا
کاربران روزانه بیش از 6 میلیارد عکس را در Google Photos آپلود می کنند، بنابراین جای تعجب نیست که بتوانیم آنها را با دست غربال کنیم. Gemini تابستان امسال به Google Photos اضافه میشود و قابلیتهای جستجوی بیشتری را از طریق ویژگی Ask Photos اضافه میکند. برای مثال، دوباره از آن بپرسید «پلاک من چیست» و عکسهای شما را جستجو میکند تا محتملترین پاسخ را بیابد، و شما را از رفتن دستی عکسهایتان برای پیدا کردن آن نجات میدهد.
Notebook LM که در سال گذشته در Google I/O مورد توجه قرار گرفت، دارای Gemini نیز خواهد بود که هوش AI را حتی به سطوح بالاتری میبرد. در طول ارائه، گوگل نشان داد که یک درس فیزیک را برای استفاده از بسکتبال به عنوان مثال اقتباس کرده است. این نوع شخصی سازی برای یادگیری احتمالاً با حرکت به سمت آینده رایج تر می شود.
Gemini 1.5 Pro از امروز به بیش از 35 زبان برای همه توسعه دهندگان و کاربران پیشرفته در دسترس خواهد بود.
عوامل Gemini می توانند این کار را برای شما انجام دهند
جمینی فقط سؤال پرسیدن و خلاصه کردن داده ها نیست – گوگل می خواهد که واقعاً کارها را برای شما انجام دهد. در حالی که نمی تواند سطل زباله را برای شما جاروبرقی کند یا بیرون بیاورد، Agents یک دستیار جدید هوش مصنوعی است که می توانید وظایفی را به آن اختصاص دهید. گوگل آن را با گرفتن عکس از یک جفت کفش و گفتن به نمایندگان برای بازگرداندن آنها نشان داد. این شرکت از هوش مصنوعی برای شناسایی کفشها استفاده کرد، جیمیل را برای رسید جستجو کرد و پیشنهاد داد که از طریق ایمیل بازگردانده شود. همچنین می توان از آن برای برنامه ریزی تعطیلات، سفرهای کاری و سایر کارهای مربوط به اطلاعات استفاده کرد.
پروژه آسترا
یکی دیگر از پروژه های آزمایشی گوگل، Astra است که Gemini را با دوربین ها متصل می کند و به آن اجازه می دهد دنیای اطراف خود را درک و تفسیر کند. در دمویی که دیدیم، Astra توانست یک اسپیکر را شناسایی کند، قسمتی از اسپیکر را که صدا تولید می کند را تجزیه کند و کد را بخواند و توضیح دهد. Astra همچنین می تواند برای افزودن هوش مصنوعی به یک جفت عینک هوشمند استفاده شود و به شما امکان می دهد بدون در دست گرفتن دوربین گوشی در مورد چیزهایی که می بینید سؤال بپرسید.
این چیزی نیست که قبلاً ندیده باشیم – ChatGPT چیزی مشابه را نشان داد – اما سخت است که بگوییم Astra چشمگیر نیست. متأسفانه، هیچ جدول زمانی برای زمان و میزان انتشار این نسخه وجود ندارد.
هوش مصنوعی مولد
هوش مصنوعی مولد رایج ترین هوش مصنوعی است و گوگل از این مهم ترین عنصر هوش مصنوعی غافل نمی شود. آخرین مدل ایجاد تصویر هوش مصنوعی آن Imagen 3 نام دارد و گوگل ادعا می کند که این بهترین مدلی است که تا به حال برای ایجاد تصاویر کلمه و همچنین درک پیام ها ساخته شده است.
به غیر از تصاویر، گوگل به سختی روی ایجاد مدلهای هوش مصنوعی برای تولید موسیقی، و همچنین Veo، یک مدل هوش مصنوعی که میتواند ویدیوهای HD بسیار چشمگیر ایجاد کند، کار کرده است. از دستورات میتوان برای ویرایش ویدیوهای موجود استفاده کرد، بنابراین لازم نیست هر بار ویدیوها را از ابتدا بازسازی کنید، و نمونههای ویدیویی نشاندادهشده قطعاً بهتر از اکثر ویدیوهای تولید شده با هوش مصنوعی به نظر میرسند. گوگل قدرت Veo را به دونالد گلاور میآورد که در حال ساخت فیلمی با استفاده از این مدل جدید هوش مصنوعی است.
آیا نگران استفاده از تصاویر، صداها و ویدیوهای تولید شده برای اهداف مخرب هستید؟ گوگل SynthID را به آثار Gemini اضافه کرد. این یک شکل نامرئی از واترمارک برای نمایش محتوای تولید شده توسط هوش مصنوعی است. ابزارهای تصویر و ویدئو را می توان در ImageFX و Video FX یافت.
هوش مصنوعی مولد نیز در جستجوی گوگل ظاهر می شود. AI Overviews به جای ارسال شما به وب سایت های مختلف، نتایج را در بالای جستجوی شما خلاصه می کند. استدلال چند مرحلهای با استفاده از نمایههای Google، پرسشهای شما را تجزیه میکند تا مرتبطترین اطلاعات را در اختیار شما قرار دهد. حتی می تواند به شما در برنامه ریزی سفر کمک کند.
یکی از تاثیرگذارترین عناصر AI Overviews امکان استفاده از آن برای پرسیدن سوال است در حین Google Lens و یک بررسی شخصی و مرتبط دریافت کنید که به سؤال پرسیده شده پاسخ می دهد. AI Reviews از امروز در ایالات متحده در دسترس خواهد بود.
جوزا و فضای کار
Gemini مدتی است که در Workspace گوگل در دسترس است، اما گوگل آماده است تا آن را به سطح بعدی برساند. یک نوار کناری مجهز به Gemini ماه آینده در دسترس خواهد بود. Gemini همچنین به زبان های بیشتری به Meet می آید.
و همانطور که انتظار دارید، Gemini در جیمیل ظاهر می شود. از او بخواهید که اطلاعات مدرسه فرزندتان را خلاصه کند و او می تواند این کار را انجام دهد یا فقط می تواند ایمیل های طولانی را خلاصه کند تا شما مجبور نباشید. سؤال یا درخواستی را وارد کنید و Gemini میتواند پاسخ دهد یا یک عمل را انجام دهد. به عنوان مثال، می تواند پیشنهادات فردی را برای کارهای ساختمانی جمع آوری کند و آنها را در لیستی برای شما قرار دهد. پاسخهای هوشمند نیز با پاسخهای هوشمند متنی ارتقا پیدا میکنند. این قابلیت ها در تابستان امسال برای کاربران Workspace Labs در دسترس است.
به زودی می توانید با هوش مصنوعی نیز کار کنید. گوگل یک “هم تیمی هوش مصنوعی” به نام چیپ را نشان داد که مسئول نظارت بر منابع تیم بود. تراشه برای پاسخ به سؤالات در چتهای Google Workspace در دسترس بود و میتوانست زمان تصمیمگیری و پیشرفت پروژه خاص را به خاطر بسپارد.
برنامه Gemini
بهعنوان یک ارتقاء یافته از دستیار Google، میتوانید با Gemini به همان روشهایی که با دستیار Google ارتباط برقرار میکنید، از جمله متن و صدا، ارتباط برقرار کنید، اما همچنین میتوانید از ویدیو و یک روش مکالمهای بیشتر برای صحبت با آن استفاده کنید. جمینی زنده.
Gemini Gems وجود دارد که نسخههای کوچکتر و سفارشیشده Gemini هستند که میتوانند در جایگاههای مختلف تخصص داشته باشند. بنابراین اگر بارها و بارها از Gemini به روشهای خاص استفاده میکنید، میتوانید یک Gem برای صرفهجویی در زمان زمانی که بارها و بارها به آن نیاز دارید، ایجاد کنید. برای مثال، میتوانید Gem را سفارشی کنید تا داستانهایی را به سبکی که ترجیح میدهید به شما بگوید، بهجای اینکه بارها و بارها با یک ربات چت هوش مصنوعی عمومی ضربه بزنید.
برنامه Gemini قادر به انجام تعدادی از کارهایی است که از یک Gemini انتظار دارید، از جمله برنامه ریزی برای سفر و تعیین مسیر. این ویژگی تابستان امسال عرضه می شود.
هوش مصنوعی و اندروید
طبیعتا گوگل Gemini را به سیستم عامل موبایل خود نیز خواهد آورد. اندروید اولین سیستم عامل موبایلی خواهد بود که از چنین مدل پیشرفته هوش مصنوعی بهره می برد و اگر طرفدار هوش مصنوعی باشید، آن را به پلتفرم انتخابی تبدیل می کند.
Circle to Search اولین بخش آن بود، اما امسال گوگل Gemini را به عنوان دستیار هوش مصنوعی پیشفرض شما در اندروید اضافه میکند – و ویژگیهای هوش مصنوعی بیشتری را در زیر کاپوت اضافه میکند.
Gemini را در اندروید به عنوان دستیار گوگل در مورد استروئیدها در نظر بگیرید. این میتواند محتوای روی صفحه شما را به صورت متنی درک کند، از جمله قادر به رمزگشایی خلاصههای ویدیوهای YouTube، ایجاد تصاویر برای پاسخ، و پاسخ به هر سؤالی که ممکن است داشته باشید – بدون خروج از صفحه نمایشی که در حال تماشای آن هستید.
قابلیت دسترسی یک ویژگی کلیدی است که توسط هوش مصنوعی ارائه شده است. ویژگی Talkback مدتی است که وجود داشته است، اما اکنون، به لطف Gemini، می توان تصاویر را با جزئیات توصیف کرد و به افراد کم بینا راه آسان تری برای استفاده از تلفن هایشان داد. و از آنجایی که Gemini در دستگاه موجود است، سریع و سریع است.
Gemini همچنین میتواند به مقابله با تماسگیرندگان هرزنامه و کلاهبرداری کمک کند. Gemini به تماسهای شما گوش میدهد و در صورت شناسایی فعالیت مشکوک به شما هشدار میدهد – و چون همه آن روی دستگاه است، اطلاعات از تلفن شما خارج نمیشود. با این حال، این ویژگی هنوز در حال توسعه است و برای مدتی در دسترس نخواهد بود.
توصیه های سردبیران