کامپیوتر

ویدیوهای تولید شده توسط هوش مصنوعی وارد شده اند و به سرعت در حال پیشرفت هستند


در چند ماه کوتاه، دنیای هوش مصنوعی مولد از چت ربات هایی مانند ChatGPT به تصاویر واقعی واقعی که توسط Midjourney ایجاد شده است، تکامل یافته است. اگر فکر می‌کردید به زودی سرعت کارها کاهش می‌یابد، ویدیوهای تولید شده با هوش مصنوعی ممکن است لحظه مهم خود را در کانون توجه قرار دهند.

همانطور که توسط a یک توییت توسط فیلیپ تسیپمن، بنیانگذار یک پلتفرم بازاریابی برای چنین ویدیوهایی، تنها در هفت روز گذشته پنج تولید کننده ویدیوی هوش مصنوعی جدید منتشر شده است. کیفیت متفاوت است، اما واضح است که فناوری با سرعتی غیرقابل پیشروی در حال حرکت است. بنابراین بیایید پنج تولیدکننده ویدیوی هوش مصنوعی را که از جسورانه تا بسیار چشمگیر هستند را بررسی کنیم.

اگر در حفظ هوش مصنوعی ویدیو مشکل دارید، ۵ مدل ویدیویی پیشرفته *در ۷ روز گذشته* منتشر شده است: 🤯😎🧵 pic.twitter.com/cki9SMfozr

– فیلیپ زیپمن (@ptsi) 26 مارس 2023

باند

Runway پیشرو در ویرایش هوش مصنوعی در دسترس عموم است. پوشش، ردیابی حرکت، حرکت فوق العاده آهسته و درجه بندی رنگ همگی از کمک هوش مصنوعی بهره می برند. این یک سرویس مبتنی بر اشتراک است، بنابراین انگیزه اضافی برای افزایش محدودیت ها وجود دارد.

باند آزمایشی را در فوریه آغاز کرد ویدیوی تولیدی با به‌روزرسانی Gen-1 که به شما امکان می‌دهد سبک ویدیو را با کلمات تغییر دهید. ویدیویی از پیاده روی در خیابان به یک فیلم انیمیشن کوتاه تبدیل می شود که به نظر می رسد با مجسمه سازی دستی و ژست شخصیت های Claymation ساخته شده است.

مطلب پیشنهادی:  Lenovo ThinkPad X1 Carbon 1309 دلار برای روز کارگر 2022 تخفیف دارد.

Runway Gen-1 را امروز به صورت عمومی منتشر کرد و در حال آزمایش Gen-2 است و نیازی به ویدیوی مرجع را از بین می برد. Runway به زودی به شما این امکان را می دهد که یک ویدیو با یک پیام متنی ساده ایجاد کنید.

Picsart

ممکن است تشخیص دهید Picsart به عنوان یک ویرایشگر عکس رایگان است اما ویرایش ویدیو را نیز ارائه می دهد. Text2Video-Zero یک ابزار تحقیقاتی Picsart است که از مولد تصویر Stable Diffusion AI برای ایجاد فریم های متعدد با اشتراکات کافی برای ایجاد یکپارچگی استفاده می کند.

این پیشرفت قابل توجهی است. آزمایش‌های اولیه در مونتاژ تصاویر هوش مصنوعی به‌عنوان فریم‌های ویدیویی صحنه‌های آشفته‌ای را ایجاد کردند که در آن همه جزئیات به طور مداوم در حال تغییر بودند. اثر چشم نواز بود اما از محتوا منحرف می شد.

ویدئو-P2P

Video-P2P یک پروژه متن باز شبیه به Runway Gen-1 است. ورودی ویدیو را می پذیرد و استفاده می کند انتشار پایدار برای استایل دادن به آن با دستورات متنی. نمونه های نشان داده شده خوب به نظر می رسند، با یک پس زمینه پایدار و یکپارچگی در عناصر تغییر یافته.

TemporalNet

TemporalNet مبتنی بر ControlNet، پیشرفته است یک تولید کننده تصویر هوش مصنوعی که امکان کنترل بیشتر بر روی ژست های چهره هایی که در عکس ها ظاهر می شوند را فراهم می کند.

ویدئوها کمی تکان دهنده هستند، اما نتایج امیدوارکننده است. ControlNet گام بزرگی در جهت ایجاد صحنه های قابل پیش بینی برداشته است و TemporalNet می تواند یک روش جایگزین خوب برای ایجاد فیلم ارائه دهد.

مطلب پیشنهادی:  به یک لپ تاپ ارزان نیاز دارید؟ امروزه این HP 14 اینچی فقط 270 دلار قیمت دارد

متن به ویدیو

Text-to-Video یک مدل هوش مصنوعی است که توسط Alibaba ساخته شده است. واضح است که این مدل به کمی کار بیشتر نیاز دارد، اما داشتن گزینه های بیشتر برای کشف همیشه چیز خوبی است.

متن به ویدیو سریع و طولانی تر با پخش کننده های 🧨

ممکن است اخیراً یک ویدیوی خنده دار متن به ویدیو از مدل تحقیقاتی ModelScope دیده باشید

با دیفیوزرها می‌توانید مدت زمان ویدیو را کنترل کنید – و آن را روی پردازنده‌های گرافیکی VRAM کوچک، از جمله همکاری رایگان، قرار دهید. اینجا را امتحان کنید:https://t.co/uPVd9hEOtr pic.twitter.com/mIFkGnGT5V

— دامن های هنری چند وجهی (@multimodalart) 22 مارس 2023

یک نوآوری سریع

سرعت سریع نوآوری در هوش مصنوعی خارق العاده است. همین چند ماه پیش ما را با نگاهی اجمالی به پتانسیل آزار می‌دادند ویدیوهای مشابه ایجاد شده در آزمایشگاه های هوش مصنوعی. در سال 2022، یکی از اولین تولیدکنندگان ویدیوی هوش مصنوعی عمومی به سادگی تصاویر کوچک هوش مصنوعی را روی فیلم‌های استوک قرار داد.

این روش های “مدرس قدیمی” چند ماه پیش خنده آور است وقتی می بینید که هوش مصنوعی در این مدت کوتاه چقدر پیشرفت کرده است.

توصیه های سردبیران






نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا