ابزار جدید OpenAI به شما امکان میدهد با تایپ یک جمله، ویدیوی واقعی بسازید
یک سگ سامویید و یک گلدن رتریور با بازیگوشی در یک شهر نئونی آیندهنگر در شب راه میروند.
OpenAI
OpenAI که سال گذشته به لطف محبوبیت ChatGPT وارد جریان اصلی شد، فناوری هوش مصنوعی خود را به ویدیو می آورد.
روز پنجشنبه، این شرکت از Sora، مدل جدید هوش مصنوعی مولد خود رونمایی کرد. Sora مشابه ابزار تصویربرداری هوش مصنوعی OpenAI، DALL-E عمل می کند. کاربر وارد صحنه مورد نظر می شود و Sora یک ویدیو با کیفیت بالا برمی گرداند. Sora همچنین میتواند ویدیوهایی با الهام از تصاویر ثابت تولید کند و ویدیوهای موجود را گسترش دهد یا فیلمهای از دست رفته را پر کند.
اکنون که چت ربات ها و تولیدکنندگان تصویر راه خود را به دنیای مصرف کننده و کسب و کار باز کرده اند، ویدئو ممکن است مرز بعدی هوش مصنوعی مولد باشد. در حالی که امکانات خلاقانه علاقه مندان به هوش مصنوعی را هیجان زده می کند، فناوری جدید با نزدیک شدن به انتخابات سیاسی بزرگ در سراسر جهان، نگرانی های جدی درباره اطلاعات غلط ایجاد می کند. بر اساس داده های Clarity، یک شرکت یادگیری ماشین، تعداد تقلب های عمیق ایجاد شده توسط هوش مصنوعی سال به سال 900 درصد افزایش یافته است.
با Sora، OpenAI قصد دارد با ابزارهای هوش مصنوعی برای تولید ویدیو از شرکت هایی مانند رقابت کند متا و گوگل، که لومیر در ژانویه اعلام کرد. ابزارهای مشابه هوش مصنوعی از دیگر استارت آپ ها مانند Stability AI که محصولی به نام Stable Video Diffusion دارد، موجود است. آمازون همچنین Create with Alexa را راهاندازی کرد، مدلی که در تولید محتوای کوتاه متحرک برای کودکان تخصص دارد.
Sora در حال حاضر محدود به تولید ویدیوهایی با طول یک دقیقه یا کمتر است. OpenAI توسط مایکروسافتدر تلاش برای ارائه مجموعه گستردهتری از مدلهای هوش مصنوعی، چندوجهی بودن (ترکیب تولید متن، تصویر و ویدیو) را به یک هدف تبدیل کرده است.
براد لایت کپ، مدیر اجرایی OpenAI در نوامبر به CNBC گفت: «جهان چندوجهی است. “اگر به نحوه پردازش ما به عنوان انسان در جهان و درگیر شدن با جهان، دیدن چیزها، شنیدن چیزها، گفتن چیزها فکر کنید – جهان بسیار بزرگتر از متن است. بنابراین برای ما همیشه این احساس ناقص بود که متن و کد تنها مدالیتهها، رابطهای واحدی باشند که میتوانستیم داشته باشیم تا اینکه این مدلها چقدر قدرتمند هستند و چه کاری میتوانند انجام دهند.”
تا به حال، Sora تنها برای گروه کوچکی از آزمایشکنندگان ایمنی یا «تیمهای قرمز» در دسترس بوده است که این مدل را برای آسیبپذیریها در زمینههایی مانند اطلاعات نادرست و سوگیری آزمایش میکنند. این شرکت تظاهرات عمومی بیش از 10 کلیپ نمونه موجود در وب سایت خود را منتشر نکرده است و گفته است که اسناد فنی همراه آن اواخر پنجشنبه منتشر خواهد شد.
OpenAI همچنین گفت که در حال ساخت یک «طبقهبندی کشف» است که میتواند کلیپهای ویدئویی تولید شده توسط Sora را شناسایی کند و قصد دارد ابرداده خاصی را در خروجی خود قرار دهد که باید به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک کند. این همان نوع ابردادهای است که متا میخواهد از آن برای شناسایی تصاویر تولید شده توسط هوش مصنوعی در این سال انتخابات استفاده کند.
Sora یک مدل هوش مصنوعی پراکنده است که مانند ChatGPT از معماری Transformer استفاده می کند که توسط محققان گوگل در مقاله ای در سال 2017 ارائه شده است.
OpenAI در اعلامیه خود نوشت: “Sora به عنوان پایه ای برای مدل هایی عمل می کند که می توانند دنیای واقعی را درک و شبیه سازی کنند.”
تماشا کردن: OpenAI در راه رسیدن به یک “پیشرفت فناوری واقعی” است
این داستان های CNBC PRO را از دست ندهید: