متا DALL-E را برای ویدیو ساخته است و هم وحشتناک و هم شگفت انگیز است
متا از یک مدل هوش مصنوعی دیوانهوار رونمایی کرد که به کاربران اجازه میدهد ورودی خود را به ویدیو تبدیل کنند. این سیستم Make-A-Video نام دارد و آخرین روند در محتوای تولید شده توسط هوش مصنوعی در وب است.
این سیستم توضیحات کوتاهی مانند «روباتی در حال موجسواری در اقیانوس» یا «یک دلقک ماهی در حال شنا در صخرههای مرجانی» میگیرد و به صورت پویا یک GIF کوتاه از توضیحات را تولید میکند. حتی سه سبک مختلف ویدیویی برای انتخاب وجود دارد: سورئال، واقع گرایانه و سبک.
با توجه به پست فیسبوکی توسط مارک زاکربرگ، مدیرعامل متا، ترجمه متن نوشته شده به ویدیو بسیار دشوارتر است زیرا ویدیو نیاز به حرکت دارد:
«تولید ویدیو بسیار دشوارتر از عکس است، زیرا علاوه بر تولید صحیح هر پیکسل، سیستم همچنین باید نحوه تغییر آنها در طول زمان را نیز پیش بینی کند. Make-A-Video این مشکل را با افزودن یک لایه یادگیری بدون نظارت حل می کند که به سیستم اجازه می دهد حرکت در دنیای فیزیکی را درک کند و آن را برای تولید متن به تصویر سنتی اعمال کند.
تیم تحقیقاتی متا مقاله ای نوشت که در آن نحوه عملکرد سیستم و تفاوت آن با روش های فعلی متن به تصویر (T2I) را شرح داد. بر خلاف سایر مدلهای زبان ماشین، روش متن به ویدیو (T2V) متا از جفتهای متن به ویدیو از پیش تعریفشده استفاده نمیکند. به عنوان مثال، «راه رفتن مرد» با ویدیویی از راه رفتن مرد واقعی مطابقت ندارد.
اگر این بسیار شبیه DALL-E، برنامه محبوب T2I به نظر می رسد، دور از دسترس نخواهید بود. سایر برنامه های کاربردی T2I پس از محبوبیت DALL-E ظهور کردند. TikTok در ماه آگوست فیلتری به نام AI Greenscreen منتشر کرد که تصاویری به سبک طراحی بر اساس کلماتی که شما تایپ می کنید تولید می کند.
محتوای تولید شده توسط هوش مصنوعی در چند سال گذشته بسیار جذاب شده است. فناوری Deepfake، تکنیکهای یادگیری ماشینی برای جایگزینی صورت یک فرد با چهره دیگر، حتی توسط استودیوهای جلوههای بصری برای نمایشهای بودجهای مانند The Mandalorian استفاده میشود.
در ماه جولای، تایمز به اشتباه درباره یک زن اوکراینی در بحبوحه جنگ روسیه و اوکراین گزارش داد. مشکل این است که او واقعی نبود.
تهدید هوش مصنوعی احتمالا یک تهدید واقعی نیست، اما پروژه هایی مانند DALL-E و Make-A-Video کاوش های سرگرم کننده ای از برخی از احتمالات جالب هستند.
توصیه های سردبیران