گوگل مدل به روز شده هوش مصنوعی را منتشر می کند که قادر به پردازش متن و ویدئوی طولانی تر است – اما همچنان توهم دارد
گوگل شرکت آلفابت نسخه جدیدی از مدل قدرتمند هوش مصنوعی خود را منتشر می کند که می گوید می تواند حجم بیشتری از متن و ویدیو را نسبت به محصولات ساخته شده توسط رقبا مدیریت کند.
مدل به روز شده هوش مصنوعی که Gemini 1.5 Pro نام دارد، روز پنجشنبه در دسترس مشتریان و توسعه دهندگان ابری قرار می گیرد تا بتوانند ویژگی های جدید آن را آزمایش کنند و به طور بالقوه برنامه های تجاری جدیدی بسازند. گوگل و رقبای آن میلیاردها دلار برای تقویت قابلیتهای خود در هوش مصنوعی مولد هزینه کردهاند و میخواهند مشتریان سازمانی را جذب کنند تا نشان دهند که سرمایهگذاریهای آنها نتیجه میدهد.
Oriol Viñales، معاون گوگل و مدیر ارشد فناوری جمینی، در نشستی با خبرنگاران گفت: «امروز، ما در درجه اول بر روی ارائه تحقیقاتی که این مدل را امکان پذیر کرده است، تمرکز کرده ایم. فردا، ما مشتاقیم ببینیم دنیا با قابلیتهای جدید چه خواهد کرد. گفت.
ما در کانال های واتس اپ هستیم. کلیک پیوستن.
پس از موفقیت غیرممکن OpenAI در اواخر سال 2022 با ربات گفتگوی ChatGPT خود، گوگل به دنبال نشان دادن این است که آن نیز نیرویی در فناوری پیشرفته هوش مصنوعی مولد است که می تواند متن، تصاویر یا حتی ویدیوی جدید را بر اساس درخواست های کاربر ایجاد کند. شرکت های بیشتری در حال آزمایش این فناوری هستند که می تواند برای خودکارسازی وظایفی مانند کدنویسی، خلاصه کردن گزارش ها یا ایجاد کمپین های بازاریابی استفاده شود.
گوگل مدل Gemini AI خود را در ماه دسامبر با سه نسخه منتشر کرد که به آن اجازه می دهد برای این کار سفارشی شود و می تواند روی همه چیز از دستگاه های تلفن همراه گرفته تا مراکز داده بزرگ اجرا شود. جمینی پاسخ گوگل به نیروهای متحد مایکروسافت است. و OpenAI، که برخی می گویند سریعتر از رونق هوش مصنوعی فعلی، از جمله در میان مشتریان و توسعه دهندگان ابری استفاده کرده اند.
اکنون گوگل به دنبال این است که این کاربران را با ابزارهای قدرتمندتر وارد اکوسیستم خود کند. به گفته Vinyals، Gemini 1.5 را میتوان سریعتر و کارآمدتر آموزش داد و این توانایی را دارد که هر بار که از آن خواسته میشود، حجم عظیمی از اطلاعات را پردازش کند. به عنوان مثال، توسعه دهندگان می توانند از Gemini 1.5 Pro برای پرس و جو تا یک ساعت ویدیو، 11 ساعت صدا یا بیش از 700000 کلمه در یک سند استفاده کنند، مقداری از داده که به گفته گوگل «طولانی ترین پنجره زمینه» در میان سایر موارد اصلی است. مدل هوش مصنوعی در مقیاس بزرگ به گفته گوگل، Gemini 1.5 میتواند دادههای بسیار بیشتری نسبت به آخرین مدلهای هوش مصنوعی OpenAI و Anthropic مدیریت کند.
در یک نمایش ویدئویی از پیش ضبط شده برای خبرنگاران، گوگل نشان داد که چگونه مهندسان از Gemini 1.5 Pro خواسته اند تا رونوشت 402 صفحه ای پی دی اف از فرود آپولو 11 بر ماه را بپذیرد و سپس آن را وادار به یافتن نقل قول هایی کردند که “سه لحظه خنده دار” را نشان می دهد. یکی از پاسخها به مدل هوش مصنوعی اشاره میکند که پنج ساعت پس از متن ماموریت آپولو 11، فضانورد مایکل کالینز به کنترل ماموریت گفت: “اگر پاسخ شما را دیر کردهایم، به این دلیل است که در حال خوردن ساندویچ هستیم.”
در دموی از پیش ضبط شده دیگری، مهندسان گوگل از Gemini 1.5 Pro خواستند تا صحنه خاصی را در یک فیلم 44 دقیقه ای باستر کیتون بیابد و طرحی تقریبی از صحنه ای که به یاد داشته را به مدل هوش مصنوعی ارائه کند. جمینی این صحنه را با موفقیت پیدا کرد و خاطرنشان کرد که این صحنه حدود 15 دقیقه پس از ویدیو رندر شده است.
با این حال، گوگل هشدار داد که مانند همه مدلهای تولیدی، پاسخها همیشه کامل نیستند. Gemini 1.5 Pro هنوز هم مستعد توهم است، گاهی اوقات کند است و همیشه مقاصد کاربران را درک نمی کند و آنها را مجبور می کند تا قبل از اینکه مدل پاسخ درستی بدهد، سؤالات خود را به روش های مختلف بپرسند. Vinyals گفت که این شرکت برای بهینه سازی عملکرد Gemini 1.5 برای سریعتر کردن آن کار می کند و هنوز در مرحله آزمایشی و در مرحله تحقیق است.
این شرکت گفت که توسعه دهندگان می توانند Gemini 1.5 Pro را با استفاده از استودیوی هوش مصنوعی گوگل کاوش کنند، در حالی که برخی از مشتریان ابری می توانند در یک پیش نمایش خصوصی از پلتفرم هوش مصنوعی Vertex سازمانی به مدل هوش مصنوعی دسترسی داشته باشند. گوگل همچنین روز پنجشنبه گفت که دسترسی به Gemini 1.0 Ultra در مقیاس بزرگ خود را گسترش خواهد داد و این مدل را به روی تعداد بیشتری از مشتریان جهانی Vertex AI باز خواهد کرد.
اخبار برتر امروز را بیشتر بخوانید:
شیدایی هوش مصنوعی! شور و شوق هوش مصنوعی که بر بازار سهام مسلط شده است، بیشترین ثروتی را که ثروتمندترین افراد جهان در سال جاری به لطف تقاضا برای تراشه های هوش مصنوعی به دست آورده اند، تشکیل می دهد. بدانید که این همه چیز در مورد چیست اینجا.
هوش مصنوعی و عشق؟ برنامه های همراه برای کنار آمدن با تنهایی یا دریافت حمایت استفاده می شود و کاربران وابستگی عاطفی به همراهان دیجیتال خود ایجاد کرده اند. دریابید که روابط انسان و هوش مصنوعی چگونه است. به این نگاه کن اینجا.
هکرها با استفاده از ChatGPT! آخرین گزارش مایکروسافت میگوید هکرهای دولت ملت از هوش مصنوعی برای تقویت حملات سایبری خود استفاده میکنند، زیرا دشمنان پیدا شدهاند که LLMهایی مانند ChatGPT OpenAI را به جعبه ابزار خود اضافه میکنند. همه چیز را در مورد آن بدانید اینجا.