آماده باشید: GIF های تولید شده با هوش مصنوعی ممکن است به زودی عرضه شوند
با وجود رباتهای گفتگو و تولیدکنندههای تبدیل متن به تصویر، اینترنت را طوفانی میکنند، مرز بعدی هوش مصنوعی ممکن است تولیدکنندگان متن به ویدیو باشد.
انویدیا اخیراً یک مقاله تحقیقاتی به نام «سنتز ویدیویی با وضوح بالا با مدلهای انتشار پنهان» درباره آزمایشهای خود در آزمایشگاه هوش مصنوعی خود در تورنتو منتشر کرده است که نحوه استفاده از Stable Diffusion را برای ایجاد ابزاری که میتواند از تصاویر متحرک به پیامهای متنی نتیجه بگیرد، توضیح میدهد.
TechRadar اشاره کرد که شرکت فناوری نمایش هایی از مدل های انتشار پنهان (LDM) را نشان داد که از متن برای تولید ویدیوها بدون پردازش کامپیوتری زیاد استفاده می کند.
این ابزار قادر به تولید تصاویر متحرک به سبک GIF است که ویدیوهایی با طول تقریبی 4.7 ثانیه با رزولوشن 1280 در 2048 هستند. طبق مقاله تحقیقاتی، همچنین قادر به ایجاد ویدیوهای طولانی تر با وضوح کمتر 512 x 1024 است.
TechRadar پس از مشاهده نسخه آزمایشی این فناوری گفت که این ابزار احتمالاً در این مرحله به عنوان یک تولید کننده متن به GIF عالی است. این نشریه خاطرنشان کرد که به راحتی می تواند از دستورات ساده ای مانند طوفان در حال جاروبرقی در ساحل یا خرس عروسکی در حال نواختن گیتار الکتریک، کیفیت بالا، 4K. با این حال، نتیجه همچنان مصنوعات تصادفی و محو شدن را در GIF ایجاد می کند، همانطور که در سایر ابزارهای AI که به طور منظم استفاده می شوند مانند Midjourney معمول است.
این نشریه بر این باور است که ویدیوهای طولانیتر هنوز قبل از رسیدن به پربیننده نیاز به توسعه بیشتری دارند، اما معتقد است که انویدیا به سرعت برای آماده کردن فناوری کار خواهد کرد. آنها می توانند برای کتابخانه های سهام و اهداف مشابه به خوبی کار کنند.
شرکتهای دیگری نیز وجود دارند که با تولیدکنندههای متن به ویدیوی هوش مصنوعی آزمایش میکنند. گوگل ژنراتور Phenaki خود را به نمایش گذاشت که به شما اجازه می دهد تا اعلان های طولانی تری برای ایجاد کلیپ های 20 ثانیه ای ایجاد کنید. استارتاپ دیگری به نام Runway ماه گذشته مدل ویدیویی نسل دوم خود را معرفی کرد که آن هم بر پایه Stable Diffusion است. تظاهرات او از سریع آفتاب اواخر بعدازظهر که از پنجره اتاق زیر شیروانی در نیویورک به چشم می خورد نشان می دهد که چگونه می توانید جلوه های متحرک نور را به تصاویر ثابت اضافه کنید.
به گزارش TechRadar، کاربران همچنین می توانند از افزودن هوش مصنوعی در برنامه های دیگر مانند Adobe Firefly و Adobe Premiere Rush بهره مند شوند.
برخی دیگر از شرکت ها مانند Narakeet و Lume5، خود را به عنوان تولید کننده متن به ویدئو تبلیغ می کنند. با این حال، بسیاری از این ابزارها بیشتر شبیه ارائه های پاورپوینت، ترکیب متن، صدا، تصاویر، و شاید برخی از اعلان های ویدیویی از قبل تولید شده، به جای ایجاد کار منحصر به فرد، کار می کنند.
توصیه های سردبیران