آماده باشید: GIF های تولید شده با هوش مصنوعی ممکن است به زودی عرضه شوند

2023-04-21

0 2 دقیقه قبل خوانده شده

با وجود ربات‌های گفتگو و تولیدکننده‌های تبدیل متن به تصویر، اینترنت را طوفانی می‌کنند، مرز بعدی هوش مصنوعی ممکن است تولیدکنندگان متن به ویدیو باشد.

انویدیا اخیراً یک مقاله تحقیقاتی به نام «سنتز ویدیویی با وضوح بالا با مدل‌های انتشار پنهان» درباره آزمایش‌های خود در آزمایشگاه هوش مصنوعی خود در تورنتو منتشر کرده است که نحوه استفاده از Stable Diffusion را برای ایجاد ابزاری که می‌تواند از تصاویر متحرک به پیام‌های متنی نتیجه بگیرد، توضیح می‌دهد.

TechRadar اشاره کرد که شرکت فناوری نمایش هایی از مدل های انتشار پنهان (LDM) را نشان داد که از متن برای تولید ویدیوها بدون پردازش کامپیوتری زیاد استفاده می کند.

این ابزار قادر به تولید تصاویر متحرک به سبک GIF است که ویدیوهایی با طول تقریبی 4.7 ثانیه با رزولوشن 1280 در 2048 هستند. طبق مقاله تحقیقاتی، همچنین قادر به ایجاد ویدیوهای طولانی تر با وضوح کمتر 512 x 1024 است.

TechRadar پس از مشاهده نسخه آزمایشی این فناوری گفت که این ابزار احتمالاً در این مرحله به عنوان یک تولید کننده متن به GIF عالی است. این نشریه خاطرنشان کرد که به راحتی می تواند از دستورات ساده ای مانند طوفان در حال جاروبرقی در ساحل یا خرس عروسکی در حال نواختن گیتار الکتریک، کیفیت بالا، 4K. با این حال، نتیجه همچنان مصنوعات تصادفی و محو شدن را در GIF ایجاد می کند، همانطور که در سایر ابزارهای AI که به طور منظم استفاده می شوند مانند Midjourney معمول است.

این نشریه بر این باور است که ویدیوهای طولانی‌تر هنوز قبل از رسیدن به پربیننده نیاز به توسعه بیشتری دارند، اما معتقد است که انویدیا به سرعت برای آماده کردن فناوری کار خواهد کرد. آنها می توانند برای کتابخانه های سهام و اهداف مشابه به خوبی کار کنند.

مطلب پیشنهادی: LG 11TC50Q Chromebook با لولای 360 درجه و صفحه نمایش 11.6 اینچی معرفی شد

شرکت‌های دیگری نیز وجود دارند که با تولیدکننده‌های متن به ویدیوی هوش مصنوعی آزمایش می‌کنند. گوگل ژنراتور Phenaki خود را به نمایش گذاشت که به شما اجازه می دهد تا اعلان های طولانی تری برای ایجاد کلیپ های 20 ثانیه ای ایجاد کنید. استارتاپ دیگری به نام Runway ماه گذشته مدل ویدیویی نسل دوم خود را معرفی کرد که آن هم بر پایه Stable Diffusion است. تظاهرات او از سریع آفتاب اواخر بعدازظهر که از پنجره اتاق زیر شیروانی در نیویورک به چشم می خورد نشان می دهد که چگونه می توانید جلوه های متحرک نور را به تصاویر ثابت اضافه کنید.

به گزارش TechRadar، کاربران همچنین می توانند از افزودن هوش مصنوعی در برنامه های دیگر مانند Adobe Firefly و Adobe Premiere Rush بهره مند شوند.

برخی دیگر از شرکت ها مانند Narakeet و Lume5، خود را به عنوان تولید کننده متن به ویدئو تبلیغ می کنند. با این حال، بسیاری از این ابزارها بیشتر شبیه ارائه های پاورپوینت، ترکیب متن، صدا، تصاویر، و شاید برخی از اعلان های ویدیویی از قبل تولید شده، به جای ایجاد کار منحصر به فرد، کار می کنند.

توصیه های سردبیران