کامپیوتر

متا DALL-E را برای ویدیو ساخته است و هم وحشتناک و هم شگفت انگیز است

متا از یک مدل هوش مصنوعی دیوانه‌وار رونمایی کرد که به کاربران اجازه می‌دهد ورودی خود را به ویدیو تبدیل کنند. این سیستم Make-A-Video نام دارد و آخرین روند در محتوای تولید شده توسط هوش مصنوعی در وب است.

این سیستم توضیحات کوتاهی مانند «روباتی در حال موج‌سواری در اقیانوس» یا «یک دلقک ماهی در حال شنا در صخره‌های مرجانی» می‌گیرد و به صورت پویا یک GIF کوتاه از توضیحات را تولید می‌کند. حتی سه سبک مختلف ویدیویی برای انتخاب وجود دارد: سورئال، واقع گرایانه و سبک.

یک هنرمند با قلم مو روی بوم نقاشی می کند، نمای نزدیک

با توجه به پست فیسبوکی توسط مارک زاکربرگ، مدیرعامل متا، ترجمه متن نوشته شده به ویدیو بسیار دشوارتر است زیرا ویدیو نیاز به حرکت دارد:

«تولید ویدیو بسیار دشوارتر از عکس است، زیرا علاوه بر تولید صحیح هر پیکسل، سیستم همچنین باید نحوه تغییر آنها در طول زمان را نیز پیش بینی کند. Make-A-Video این مشکل را با افزودن یک لایه یادگیری بدون نظارت حل می کند که به سیستم اجازه می دهد حرکت در دنیای فیزیکی را درک کند و آن را برای تولید متن به تصویر سنتی اعمال کند.

زوج جوانی در زیر باران سیل آسا قدم می زنند

تیم تحقیقاتی متا مقاله ای نوشت که در آن نحوه عملکرد سیستم و تفاوت آن با روش های فعلی متن به تصویر (T2I) را شرح داد. بر خلاف سایر مدل‌های زبان ماشین، روش متن به ویدیو (T2V) متا از جفت‌های متن به ویدیو از پیش تعریف‌شده استفاده نمی‌کند. به عنوان مثال، «راه رفتن مرد» با ویدیویی از راه رفتن مرد واقعی مطابقت ندارد.

مطلب پیشنهادی:  مانیتور گیمینگ OLED جدید سامسونگ ممکن است مشکل داشته باشد

اگر این بسیار شبیه DALL-E، برنامه محبوب T2I به نظر می رسد، دور از دسترس نخواهید بود. سایر برنامه های کاربردی T2I پس از محبوبیت DALL-E ظهور کردند. TikTok در ماه آگوست فیلتری به نام AI Greenscreen منتشر کرد که تصاویری به سبک طراحی بر اساس کلماتی که شما تایپ می کنید تولید می کند.

کودک تنبل کرکی با کلاه بافتنی نارنجی در تلاش برای تشخیص نمای نزدیک لپ تاپ با نورپردازی بسیار دقیق استودیویی که در چشمانش منعکس می شود

محتوای تولید شده توسط هوش مصنوعی در چند سال گذشته بسیار جذاب شده است. فناوری Deepfake، تکنیک‌های یادگیری ماشینی برای جایگزینی صورت یک فرد با چهره دیگر، حتی توسط استودیوهای جلوه‌های بصری برای نمایش‌های بودجه‌ای مانند The Mandalorian استفاده می‌شود.

در ماه جولای، تایمز به اشتباه درباره یک زن اوکراینی در بحبوحه جنگ روسیه و اوکراین گزارش داد. مشکل این است که او واقعی نبود.

تهدید هوش مصنوعی احتمالا یک تهدید واقعی نیست، اما پروژه هایی مانند DALL-E و Make-A-Video کاوش های سرگرم کننده ای از برخی از احتمالات جالب هستند.

توصیه های سردبیران






نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا