ویدیوهای تولید شده توسط هوش مصنوعی وارد شده اند و به سرعت در حال پیشرفت هستند
در چند ماه کوتاه، دنیای هوش مصنوعی مولد از چت ربات هایی مانند ChatGPT به تصاویر واقعی واقعی که توسط Midjourney ایجاد شده است، تکامل یافته است. اگر فکر میکردید به زودی سرعت کارها کاهش مییابد، ویدیوهای تولید شده با هوش مصنوعی ممکن است لحظه مهم خود را در کانون توجه قرار دهند.
همانطور که توسط a یک توییت توسط فیلیپ تسیپمن، بنیانگذار یک پلتفرم بازاریابی برای چنین ویدیوهایی، تنها در هفت روز گذشته پنج تولید کننده ویدیوی هوش مصنوعی جدید منتشر شده است. کیفیت متفاوت است، اما واضح است که فناوری با سرعتی غیرقابل پیشروی در حال حرکت است. بنابراین بیایید پنج تولیدکننده ویدیوی هوش مصنوعی را که از جسورانه تا بسیار چشمگیر هستند را بررسی کنیم.
باند
Runway پیشرو در ویرایش هوش مصنوعی در دسترس عموم است. پوشش، ردیابی حرکت، حرکت فوق العاده آهسته و درجه بندی رنگ همگی از کمک هوش مصنوعی بهره می برند. این یک سرویس مبتنی بر اشتراک است، بنابراین انگیزه اضافی برای افزایش محدودیت ها وجود دارد.
باند آزمایشی را در فوریه آغاز کرد ویدیوی تولیدی با بهروزرسانی Gen-1 که به شما امکان میدهد سبک ویدیو را با کلمات تغییر دهید. ویدیویی از پیاده روی در خیابان به یک فیلم انیمیشن کوتاه تبدیل می شود که به نظر می رسد با مجسمه سازی دستی و ژست شخصیت های Claymation ساخته شده است.
Runway Gen-1 را امروز به صورت عمومی منتشر کرد و در حال آزمایش Gen-2 است و نیازی به ویدیوی مرجع را از بین می برد. Runway به زودی به شما این امکان را می دهد که یک ویدیو با یک پیام متنی ساده ایجاد کنید.
Picsart
این پیشرفت قابل توجهی است. آزمایشهای اولیه در مونتاژ تصاویر هوش مصنوعی بهعنوان فریمهای ویدیویی صحنههای آشفتهای را ایجاد کردند که در آن همه جزئیات به طور مداوم در حال تغییر بودند. اثر چشم نواز بود اما از محتوا منحرف می شد.
ویدئو-P2P
Video-P2P یک پروژه متن باز شبیه به Runway Gen-1 است. ورودی ویدیو را می پذیرد و استفاده می کند انتشار پایدار برای استایل دادن به آن با دستورات متنی. نمونه های نشان داده شده خوب به نظر می رسند، با یک پس زمینه پایدار و یکپارچگی در عناصر تغییر یافته.
TemporalNet
TemporalNet مبتنی بر ControlNet، پیشرفته است یک تولید کننده تصویر هوش مصنوعی که امکان کنترل بیشتر بر روی ژست های چهره هایی که در عکس ها ظاهر می شوند را فراهم می کند.
ویدئوها کمی تکان دهنده هستند، اما نتایج امیدوارکننده است. ControlNet گام بزرگی در جهت ایجاد صحنه های قابل پیش بینی برداشته است و TemporalNet می تواند یک روش جایگزین خوب برای ایجاد فیلم ارائه دهد.
متن به ویدیو
Text-to-Video یک مدل هوش مصنوعی است که توسط Alibaba ساخته شده است. واضح است که این مدل به کمی کار بیشتر نیاز دارد، اما داشتن گزینه های بیشتر برای کشف همیشه چیز خوبی است.
یک نوآوری سریع
سرعت سریع نوآوری در هوش مصنوعی خارق العاده است. همین چند ماه پیش ما را با نگاهی اجمالی به پتانسیل آزار میدادند ویدیوهای مشابه ایجاد شده در آزمایشگاه های هوش مصنوعی. در سال 2022، یکی از اولین تولیدکنندگان ویدیوی هوش مصنوعی عمومی به سادگی تصاویر کوچک هوش مصنوعی را روی فیلمهای استوک قرار داد.
این روش های “مدرس قدیمی” چند ماه پیش خنده آور است وقتی می بینید که هوش مصنوعی در این مدت کوتاه چقدر پیشرفت کرده است.
توصیه های سردبیران