تکنولوژی

ابزار جدید OpenAI به شما امکان می‌دهد با تایپ یک جمله، ویدیوی واقعی بسازید

یک سگ سامویید و یک گلدن رتریور با بازیگوشی در یک شهر نئونی آینده‌نگر در شب راه می‌روند.

OpenAI

OpenAI که سال گذشته به لطف محبوبیت ChatGPT وارد جریان اصلی شد، فناوری هوش مصنوعی خود را به ویدیو می آورد.

روز پنجشنبه، این شرکت از Sora، مدل جدید هوش مصنوعی مولد خود رونمایی کرد. Sora مشابه ابزار تصویربرداری هوش مصنوعی OpenAI، DALL-E عمل می کند. کاربر وارد صحنه مورد نظر می شود و Sora یک ویدیو با کیفیت بالا برمی گرداند. Sora همچنین می‌تواند ویدیوهایی با الهام از تصاویر ثابت تولید کند و ویدیوهای موجود را گسترش دهد یا فیلم‌های از دست رفته را پر کند.

اکنون که چت ربات ها و تولیدکنندگان تصویر راه خود را به دنیای مصرف کننده و کسب و کار باز کرده اند، ویدئو ممکن است مرز بعدی هوش مصنوعی مولد باشد. در حالی که امکانات خلاقانه علاقه مندان به هوش مصنوعی را هیجان زده می کند، فناوری جدید با نزدیک شدن به انتخابات سیاسی بزرگ در سراسر جهان، نگرانی های جدی درباره اطلاعات غلط ایجاد می کند. بر اساس داده های Clarity، یک شرکت یادگیری ماشین، تعداد تقلب های عمیق ایجاد شده توسط هوش مصنوعی سال به سال 900 درصد افزایش یافته است.

با Sora، OpenAI قصد دارد با ابزارهای هوش مصنوعی برای تولید ویدیو از شرکت هایی مانند رقابت کند متا و گوگل، که لومیر در ژانویه اعلام کرد. ابزارهای مشابه هوش مصنوعی از دیگر استارت آپ ها مانند Stability AI که محصولی به نام Stable Video Diffusion دارد، موجود است. آمازون همچنین Create with Alexa را راه‌اندازی کرد، مدلی که در تولید محتوای کوتاه متحرک برای کودکان تخصص دارد.

مطلب پیشنهادی:  اتریوم با سرد شدن شوق «ادغام» با «سه‌گانه بلاک چین» روبرو می‌شود

Sora در حال حاضر محدود به تولید ویدیوهایی با طول یک دقیقه یا کمتر است. OpenAI توسط مایکروسافتدر تلاش برای ارائه مجموعه گسترده‌تری از مدل‌های هوش مصنوعی، چندوجهی بودن (ترکیب تولید متن، تصویر و ویدیو) را به یک هدف تبدیل کرده است.

براد لایت کپ، مدیر اجرایی OpenAI در نوامبر به CNBC گفت: «جهان چندوجهی است. “اگر به نحوه پردازش ما به عنوان انسان در جهان و درگیر شدن با جهان، دیدن چیزها، شنیدن چیزها، گفتن چیزها فکر کنید – جهان بسیار بزرگتر از متن است. بنابراین برای ما همیشه این احساس ناقص بود که متن و کد تنها مدالیته‌ها، رابط‌های واحدی باشند که می‌توانستیم داشته باشیم تا اینکه این مدل‌ها چقدر قدرتمند هستند و چه کاری می‌توانند انجام دهند.”

تا به حال، Sora تنها برای گروه کوچکی از آزمایش‌کنندگان ایمنی یا «تیم‌های قرمز» در دسترس بوده است که این مدل را برای آسیب‌پذیری‌ها در زمینه‌هایی مانند اطلاعات نادرست و سوگیری آزمایش می‌کنند. این شرکت تظاهرات عمومی بیش از 10 کلیپ نمونه موجود در وب سایت خود را منتشر نکرده است و گفته است که اسناد فنی همراه آن اواخر پنجشنبه منتشر خواهد شد.

OpenAI همچنین گفت که در حال ساخت یک «طبقه‌بندی کشف» است که می‌تواند کلیپ‌های ویدئویی تولید شده توسط Sora را شناسایی کند و قصد دارد ابرداده خاصی را در خروجی خود قرار دهد که باید به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک کند. این همان نوع ابرداده‌ای است که متا می‌خواهد از آن برای شناسایی تصاویر تولید شده توسط هوش مصنوعی در این سال انتخابات استفاده کند.

مطلب پیشنهادی:  ناسا قصد دارد پرواز آزمایشی ماه آرتمیس را در 14 نوامبر 2022 دوباره راه اندازی کند.

Sora یک مدل هوش مصنوعی پراکنده است که مانند ChatGPT از معماری Transformer استفاده می کند که توسط محققان گوگل در مقاله ای در سال 2017 ارائه شده است.

OpenAI در اعلامیه خود نوشت: “Sora به عنوان پایه ای برای مدل هایی عمل می کند که می توانند دنیای واقعی را درک و شبیه سازی کنند.”

تماشا کردن: OpenAI در راه رسیدن به یک “پیشرفت فناوری واقعی” است

جف لوئیس از Bedrock می گوید OpenAI در راه رسیدن به یک

این داستان های CNBC PRO را از دست ندهید:

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا