ابزار جدید OpenAI به شما امکان می‌دهد با تایپ یک جمله، ویدیوی واقعی بسازید

2024-02-17

0 2 دقیقه قبل خوانده شده

یک سگ سامویید و یک گلدن رتریور با بازیگوشی در یک شهر نئونی آینده‌نگر در شب راه می‌روند.

OpenAI

OpenAI که سال گذشته به لطف محبوبیت ChatGPT وارد جریان اصلی شد، فناوری هوش مصنوعی خود را به ویدیو می آورد.

روز پنجشنبه، این شرکت از Sora، مدل جدید هوش مصنوعی مولد خود رونمایی کرد. Sora مشابه ابزار تصویربرداری هوش مصنوعی OpenAI، DALL-E عمل می کند. کاربر وارد صحنه مورد نظر می شود و Sora یک ویدیو با کیفیت بالا برمی گرداند. Sora همچنین می‌تواند ویدیوهایی با الهام از تصاویر ثابت تولید کند و ویدیوهای موجود را گسترش دهد یا فیلم‌های از دست رفته را پر کند.

اکنون که چت ربات ها و تولیدکنندگان تصویر راه خود را به دنیای مصرف کننده و کسب و کار باز کرده اند، ویدئو ممکن است مرز بعدی هوش مصنوعی مولد باشد. در حالی که امکانات خلاقانه علاقه مندان به هوش مصنوعی را هیجان زده می کند، فناوری جدید با نزدیک شدن به انتخابات سیاسی بزرگ در سراسر جهان، نگرانی های جدی درباره اطلاعات غلط ایجاد می کند. بر اساس داده های Clarity، یک شرکت یادگیری ماشین، تعداد تقلب های عمیق ایجاد شده توسط هوش مصنوعی سال به سال 900 درصد افزایش یافته است.

با Sora، OpenAI قصد دارد با ابزارهای هوش مصنوعی برای تولید ویدیو از شرکت هایی مانند رقابت کند متا و گوگل، که لومیر در ژانویه اعلام کرد. ابزارهای مشابه هوش مصنوعی از دیگر استارت آپ ها مانند Stability AI که محصولی به نام Stable Video Diffusion دارد، موجود است. آمازون همچنین Create with Alexa را راه‌اندازی کرد، مدلی که در تولید محتوای کوتاه متحرک برای کودکان تخصص دارد.

مطلب پیشنهادی: ایلان ماسک می‌گوید: اولین بیمار Neuralink به طور کامل بهبود یافت و می‌تواند مکان‌نمای کامپیوتر را فقط با فکر کردن حرکت دهد

Sora در حال حاضر محدود به تولید ویدیوهایی با طول یک دقیقه یا کمتر است. OpenAI توسط مایکروسافتدر تلاش برای ارائه مجموعه گسترده‌تری از مدل‌های هوش مصنوعی، چندوجهی بودن (ترکیب تولید متن، تصویر و ویدیو) را به یک هدف تبدیل کرده است.

براد لایت کپ، مدیر اجرایی OpenAI در نوامبر به CNBC گفت: «جهان چندوجهی است. “اگر به نحوه پردازش ما به عنوان انسان در جهان و درگیر شدن با جهان، دیدن چیزها، شنیدن چیزها، گفتن چیزها فکر کنید – جهان بسیار بزرگتر از متن است. بنابراین برای ما همیشه این احساس ناقص بود که متن و کد تنها مدالیته‌ها، رابط‌های واحدی باشند که می‌توانستیم داشته باشیم تا اینکه این مدل‌ها چقدر قدرتمند هستند و چه کاری می‌توانند انجام دهند.”

تا به حال، Sora تنها برای گروه کوچکی از آزمایش‌کنندگان ایمنی یا «تیم‌های قرمز» در دسترس بوده است که این مدل را برای آسیب‌پذیری‌ها در زمینه‌هایی مانند اطلاعات نادرست و سوگیری آزمایش می‌کنند. این شرکت تظاهرات عمومی بیش از 10 کلیپ نمونه موجود در وب سایت خود را منتشر نکرده است و گفته است که اسناد فنی همراه آن اواخر پنجشنبه منتشر خواهد شد.

OpenAI همچنین گفت که در حال ساخت یک «طبقه‌بندی کشف» است که می‌تواند کلیپ‌های ویدئویی تولید شده توسط Sora را شناسایی کند و قصد دارد ابرداده خاصی را در خروجی خود قرار دهد که باید به شناسایی محتوای تولید شده توسط هوش مصنوعی کمک کند. این همان نوع ابرداده‌ای است که متا می‌خواهد از آن برای شناسایی تصاویر تولید شده توسط هوش مصنوعی در این سال انتخابات استفاده کند.

مطلب پیشنهادی: مدیر عامل آمازون، جاسی، قانونگذاران را پس از شکست در قرارداد iRobot طرد کرد

Sora یک مدل هوش مصنوعی پراکنده است که مانند ChatGPT از معماری Transformer استفاده می کند که توسط محققان گوگل در مقاله ای در سال 2017 ارائه شده است.

OpenAI در اعلامیه خود نوشت: “Sora به عنوان پایه ای برای مدل هایی عمل می کند که می توانند دنیای واقعی را درک و شبیه سازی کنند.”

تماشا کردن: OpenAI در راه رسیدن به یک “پیشرفت فناوری واقعی” است

جف لوئیس از Bedrock می گوید OpenAI در راه رسیدن به یک

این داستان های CNBC PRO را از دست ندهید:

2024-02-17

0 2 دقیقه قبل خوانده شده

ابزار جدید OpenAI به شما امکان می‌دهد با تایپ یک جمله، ویدیوی واقعی بسازید

دیدگاهتان را بنویسید لغو پاسخ

قالب وودمارت

Google Project Gameface مبتنی بر دسترسی را در اندروید راه‌اندازی می‌کند تا ناوبری بدون هندز را ارائه دهد

شرکت‌های هندی تا سال 2027 بیش از 5 میلیارد دلار برای فناوری هوش مصنوعی هزینه خواهند کرد: همه جزئیات

موتورولا Razr، Razr 50 Ultra Design پیش نمایش Surface Online; مشخصات Razr 50 لو رفت: تصاویر را ببینید

دولت در مورد کلاهبرداری های «دستگیری دیجیتالی» هشدار بزرگی صادر می کند – جزئیاتی که باید بدانید

4 ویژگی پیشرفته لپ‌تاپ‌های ویندوزی هنوز نسبت به مک‌بوک‌ها دارند

گوگل چیزی را ارائه کرده است که می تواند بزرگترین محصول سال های اخیر آنها باشد

اپل در حال ارائه یک ویژگی جدید برای کاهش بیماری حرکت برای کاربران آیفون و آیپد است

Samsung Galaxy Z Fold 6 در Geekbench ظاهر می شود. قرار است دوربین های بهتری نسبت به گلکسی اس 24 ارائه دهد

زن ساکن بمبئی به دلیل این کلاهبرداری جدید 54 میلیون روپیه به صورت آنلاین از دست می دهد – تمام جزئیاتی که باید بدانید

نوشته های مشابه

محققان بزرگترین برخورد شهاب تازه شناخته شده را در مریخ کشف کردند

موزیلا پرچم قرمزی را روی برنامه های دوستیابی تشنه داده به اهتزاز در می آورد

تکان دهنده! ایلان ماسک سیستم تیک آبی توییتر را “بیهوده” می نامد اما در ساعت 8 شب به آن امتیاز می دهد.

Google Cloud خدمات مشاوره ای را برای کمک به مشتریان در استفاده از هوش مصنوعی راه اندازی می کند

دیدگاهتان را بنویسید لغو پاسخ