12 اعلان بزرگ ارائه شده در Google I/O 2024 که نمی توانید از دست بدهید: Gemini 1.5 Flash، Veo، Project Astra و موارد دیگر
گوگل رویداد سالانه توسعه دهندگان خود، Google I/O 2024 را در 14 می با وعده بحث در مورد هوش مصنوعی برگزار کرد. این شرکت به قول خود وفادار بود زیرا چندین ویژگی جدید و بهبود هوش مصنوعی را برای Android، Search، Workspace، Photos و سایر خدمات در طول رویداد اعلام کرد. با این حال، برخی از پیام های کلیدی وجود داشت که توجه مخاطبانی را که از خانه یا زنده تماشا می کردند، به خود جلب کرد. تمرکز اصلی این رویداد مدل هوش مصنوعی Gemini و ادغام آن با سایر برنامه های گوگل بود، بیایید نگاهی به تمام نکات برجسته این رویداد بیندازیم.
نکات کلیدی Google I/O
- ویژگی Ask Photos: Gemini در برنامه Google Photos با ارائه یک فرمان ساده به ربات چت به کاربران کمک میکند تصاویر را پیدا کنند. ساندار پیچای، مدیر عامل آلفابت نیز با مثالی از یافتن “شماره پلاک مجوز” نشان داد که این ویژگی چگونه کار می کند.
- فلش Gemini 1.5: این چند مدل سبک وزن و مبتنی بر هوش مصنوعی گوگل است که سریعتر و مقرون به صرفه است. مدل هوش مصنوعی گوگل برای «کارهای باریک، با فرکانس بالا و تأخیر کم» بهینه شده است. میتواند کارهایی مانند خلاصهسازی، برنامههای چت، شرح تصویر و ویدیو، استخراج دادهها از اسناد و جداول طولانی و غیره را انجام دهد.
3. Gemini برای Google Workspace: Google Gemini 1.5 Pro را در برنامه های Workspace مانند Docs، Gmail، Gmeet، Drive و سایر برنامه ها ادغام خواهد کرد. در Gmail، ربات چت میتواند پیامها را در عرض چند ثانیه خلاصه کند و به آنها پاسخ دهد. این ویژگی ها در ماه ژوئن در اختیار کاربران Advanced Gemini قرار خواهد گرفت.
4. Gemini 1.5 Pro: Sundar Pichai اعلام کرد که مدل قدرتمند هوش مصنوعی یک پنجره زمینه بزرگتر با 2 میلیون توکن در یک پیشنمایش خصوصی اضافه میکند و به ربات چت اجازه میدهد تا کارهای پیچیدهتری مانند تجزیه و تحلیل اسناد طولانیتر، پایگاههای کد، ویدیوها و موارد دیگر را انجام دهد.
5. Project Astra: این اعلامیه توجه را به قابلیت های هوش مصنوعی مورد استفاده برای انجام چندین کار روزمره جلب کرد. Project Astra یک دستیار هوش مصنوعی چندوجهی است که از طریق دوربین دستگاه کار می کند. عامل هوش مصنوعی می تواند برای پیدا کردن و مکان یابی اشیا در صورت گم شدن آنها استفاده شود.
6. Gems: گوگل یک سازنده چت بات به نام Gems را معرفی کرد که به کاربران اجازه می دهد نسخه سفارشی سازی شده دستیار Gemini را توسعه دهند. کاربران اکنون می توانند نحوه واکنش Gemini را از نظر شخصیت، لحن یا تخصص سفارشی کنند.
7. Veo: گوگل یک تولید کننده ویدیوی هوش مصنوعی جدید را معرفی کرد که می تواند ویدیوهای با کیفیت 1080p طولانی تر از یک دقیقه ایجاد کند. این ابزار برای درک اعلانهای مبتنی بر جلوههای سینمایی مختلف، تغییرات و موارد دیگر طراحی شده است که برای ایجاد یک ویدیوی لذتبخش لازم است.
8. Gemini Nano به Chrome: گوگل همچنین از ادغام Gemini Nano به Chrome در دسکتاپ خبر داد. این یک دستیار داخلی است که روی دستگاه کار می کند و به کاربران امکان می دهد متن تولید کنند و همچنین می تواند کارهایی مانند تکمیل خودکار را انجام دهد.
9. Gemini در اندروید: گوگل اعلام کرد که دستیار جدیدی با هوش مصنوعی به دستگاه های اندرویدی اضافه می کند که به کاربران کمک می کند خلاق و سازنده باشند. این دستیار دارای ویژگیهایی مانند «از این ویدیو بپرس» یا «از این PDF بپرس» است که میتواند به سادگی به درخواستهای کاربر پاسخ دهد. این ویژگیها در Gmail، Google Messages و YouTube کار خواهند کرد. همچنین شامل کشف تقلب نیز می شود.
10. Trillium: گوگل نسل ششم Google Cloud TPU را معرفی کرد. عملکرد محاسباتی تراشه Trillium بهبود یافته، ظرفیت حافظه با پهنای باند بالا (HBM) و مهمتر از همه، قدرت نسل بعدی مدلهای هوش مصنوعی را فراهم میکند.
11. دایره جستجو گسترش می یابد: این ویژگی اکنون پیشرفته تر و توانمندتر است زیرا می تواند به کاربران کمک کند تا یک مسئله ریاضی را روی صفحه نمایش خود حل کنند و راه حل صحیح را ارائه دهند. علاوه بر این، تا پایان سال برای دستگاه های بیشتری در دسترس خواهد بود.
12. SynthID AI Watermark: این شرکت هوش مصنوعی SynthID را به ویدیوهای Veo برای واترمارک و تشخیص ویدیوهای تولید شده توسط هوش مصنوعی گسترش می دهد.
یک چیز دیگر! ما اکنون در کانال های واتس اپ هستیم! ما را در آنجا دنبال کنید تا هیچ به روز رسانی دنیای فناوری را از دست ندهید. برای دنبال کردن کانال واتساپ HT Tech کلیک کنیداینجا برای پیوستن به هم اکنون!