ویدئوهای هوش مصنوعی گوگل به آینده ای که توسط ماشین تولید می شود اشاره می کند

2022-10-09

0 4 دقیقه قبل خوانده شده

محققان هوش مصنوعی در Meta Platforms Inc. و گوگل شرکت آلفابت. یک جهش فوق العاده به جلو انجام داد.

توانایی های خلاقانه هوش مصنوعی از مهارت های رانندگی آن پیشی می گیرد. در حالی که فناوری خودروهای خودران راه به جایی نمی برد، انفجار قابل توجهی در تحقیقات پیرامون مدل های مولد یا سیستم های هوش مصنوعی که می توانند تصاویر را از متن ساده ایجاد کنند، رخ داده است. همین هفته گذشته، محققان هوش مصنوعی در Meta Platforms Inc. و گوگل شرکت آلفابت. با توسعه سیستم‌هایی که می‌توانند تقریباً با هر متنی که تصور می‌شود ویدیو تولید کنند، گامی فوق‌العاده به جلو برداشته‌اند.

ویدیوهای متا، که مادر فیس‌بوک است، شبیه به سکانس‌های رویایی هستند که خرس عروسکی را در حال نقاشی گل‌ها یا اسبی با پاهای دراز در زمین نشان می‌دهد. آنها تقریباً یک یا دو ثانیه دوام می آورند و کیفیت نامناسبی دارند که منبع آنها را نشان می دهد، اما همچنان قابل توجه هستند. ویدئوهای تولید شده توسط گوگل از ریختن قهوه در فنجان یا پرواز بر فراز یک کوه برفی بسیار واقعی به نظر می رسد.

گوگل یک سیستم دوم حتی چشمگیرتر به نام Phenaki ایجاد کرده است که می تواند ویدیوهای طولانی تری به مدت دو دقیقه یا بیشتر ایجاد کند. در اینجا نمونه ای از درخواست استفاده شده توسط گوگل برای یکی آورده شده است:

ترافیک زیاد در یک شهر آینده نگر. یک سفینه فضایی بیگانه به شهر آینده نگر می رسد. دوربین وارد سفینه فضایی بیگانگان می شود. دوربین به جلو حرکت می کند تا زمانی که یک فضانورد را در اتاق آبی نشان دهد. فضانورد در حال تایپ کردن روی صفحه کلید است. دوربین از فضانورد دور می شود. فضانورد صفحه کلید را زمین می گذارد و به چپ می رود…”

مطلب پیشنهادی: سامسونگ می گوید می تواند بیکسبی را با هوش مصنوعی مولد ارتقا دهد

این کمتر از یک سوم کل اعلان است که تقریباً مانند یک فیلمنامه با دستوراتی مانند “بزرگنمایی دوربین” خوانده می شود. و در اینجا کلیپ حاصل که توسط دومیترو ارهان، یکی از خالقان فناکی در Google Brain در توییتر ارسال شده است:

ممکن است فکر کنید که این پایان هالیوود است که ما آن را می شناسیم، یا هرکسی که چند سلول مغز و یک کامپیوتر داشته باشد به زودی قادر به تولید فیلم های بلند خواهد بود. این در واقع با آنچه محققان امیدوار بودند مطابقت دارد. ارهان در توییتی نوشت که او و تیمش می‌خواهند به مردم قدرت دهند تا داستان‌های بصری خود را بسازند… [to] خلاقیت را برای مردم آسان تر کنید.»

دیدن ویدیوهای تولید شده توسط هوش مصنوعی به این زودی ها به سینمای محلی شما سخت است. اما تقریباً مطمئناً آنها را در فیدهای رسانه های اجتماعی خود خواهیم دید، به ویژه در پلتفرم هایی مانند TikTok شرکت ByteDance Ltd.، Reels اینستاگرام یا YouTube.

TikTok به سؤالی در مورد اینکه آیا در حال ساخت ابزار تولید ویدیوی هوش مصنوعی خود است یا خیر پاسخ نداد، اما منطقی است که این پلتفرم این کار را انجام دهد. کاربران TikTok دوست دارند استیکر، متن و صفحه سبز را به پست های خود اضافه کنند و این پلتفرم با فناوری های جدید به تقاضا پاسخ می دهد. در ماه آگوست، یک تولید کننده تصویر هوش مصنوعی برای ایجاد صفحه نمایش های سبز سبک به برنامه خود اضافه کرد. درخواستی مانند «بوریس جانسون» را وارد کنید و TikTok تصویری انتزاعی را نمایش می‌دهد که به طور مبهم یادآور نخست‌وزیر سابق بریتانیا است.

مطلب پیشنهادی: ریلمی می‌خواهد با عرضه سری P در سال 2024 در بخش 15 تا 25 هزار روپیه شماره یک باشد.

چه اتفاقی می‌افتد وقتی ماشین‌ها نه تنها ویدیوهایی را توصیه می‌کنند که ما را در پیمایش نگه می‌دارند، بلکه دست بزرگ‌تری در ایجاد آنها دارند؟ بسیاری از ما از تماشای فیلم‌هایی از گربه‌های بامزه و افرادی که روی خودشان می‌لنگند لذت می‌بریم، بنابراین الگوریتمی که می‌تواند مونتاژهای جعلی از تلو خوردن‌های ناخوشایند یا بچه گربه‌های سریع ایجاد کند، تا زمانی که واقعی به نظر می‌رسند، بازدیدهای ویروسی را با کمی کار جذب می‌کند.

سازندگان محتوای TikTok و خود پلتفرم‌ها انگیزه‌ای برای استفاده از ابزاری دارند که می‌تواند ویدیوها را در مقیاس تولید کند، به‌خصوص زمانی که ارزان و آسان باشد. برای بقیه ما، نتیجه فیدهای رسانه های اجتماعی خواهد بود که بیش از همیشه ماشین محور هستند. ویدئوهای هوش مصنوعی که قبلاً توسط هوش مصنوعی و الگوریتم‌های توصیه‌ای ارائه شده‌اند، به حلقه‌های بازخورد خود تقویت‌کننده‌ای اضافه می‌کنند که خارش‌های شناختی ما را خنثی می‌کنند.

پیامد احتمالی دیگر سیل اطلاعات نادرست است، اما ممکن است در کوتاه مدت نیاز کمتری به نگرانی در مورد این موضوع وجود داشته باشد. پلتفرم‌های رسانه‌های اجتماعی تلاش‌ها را برای حذف محتوای جعلی افزایش می‌دهند، و گوگل و فیس‌بوک هر دو از انتشار ابزارهای ایجاد ویدیو برای عموم خودداری می‌کنند، زیرا احتمال سوءاستفاده (و احتمالاً روابط عمومی بد) وجود دارد. گوگل گفت که سیستم خود آنها ویدیوهایی را تولید می کند که علیه زنان مغرضانه است، حتی زمانی که آنها سعی می کنند نتایج کلیشه ای را فیلتر کنند. به گفته محققان گوگل، مدل یا کد منبع آن تا زمانی که مشکل برطرف نشود، منتشر نخواهد شد.

البته به لطف سازمان هایی مانند Stability AI به زودی می توانید با محدودیت های کمی از این ابزارها استفاده کنید. این استارت آپ بریتانیایی در آگوست گذشته ابزاری برای تولید تصویر راه اندازی کرد که به هر کسی اجازه می داد آثار هنری جالب و همچنین عکس های جعلی از افراد مشهور، سیاستمداران و مناطق جنگی تولید کند، چیزی که شرکت های بزرگتر هوش مصنوعی ممنوع کرده اند. من این ابزار را آزمایش کردم و در عرض چند ثانیه توانستم عکس‌های دونالد ترامپ، رئیس جمهور سابق آمریکا را در حال بازی گلف با رهبر کره شمالی، کیم جونگ اون، تهیه کنم. Stability در حال کار بر روی یک ابزار تولید ویدیو است که قصد دارد پس از آماده شدن آن را به صورت عمومی منتشر کند.

مطلب پیشنهادی: درآمد Airbnb (ABNB) Q1 2024

اما در حالی که دسترسی بیشتر به چنین ابزارهایی منجر به محتوای جعلی بیشتر می شود، به این معنی است که افراد بیشتری از وجود ابزارها آگاه هستند. آنها به احتمال زیاد مشکوک هستند که “عکس” رئیس جمهور جو بایدن در حال مشت زدن به یک خانم مسن توسط هوش مصنوعی ایجاد شده است. با این حال، این امید است.

به همان اندازه نگران کننده این است که این ابزارها با رژیم غذایی روزانه مردم چه می کنند. محققان گوگل ادعا می کنند که ابزار آنها خلاقیت انسان را افزایش می دهد. اما وقتی ساختن یک ویدیو آنقدر آسان می شود که به سختی لازم است به آن فکر کنید، آیا واقعاً تخیل ما را مهار می کند؟ شاید در هر موردی نه.

همراه با موتورهای ارجاعی که بسیاری از آنچه را که ما آنلاین دیده‌ایم با هدف ایجاد کلیک هدایت می‌کنند، آینده ما را بسیار ماشین‌محورتر و شاید نه چندان خلاقانه‌تر نشان می‌دهد.

پارمی اولسون ستون نویس فناوری Bloomberg Opinion است. او خبرنگار سابق وال استریت ژورنال و فوربس، نویسنده کتاب ما ناشناس هستیم.

2022-10-09

0 4 دقیقه قبل خوانده شده

ویدئوهای هوش مصنوعی گوگل به آینده ای که توسط ماشین تولید می شود اشاره می کند

دیدگاهتان را بنویسید لغو پاسخ

قالب وودمارت

Google Project Gameface مبتنی بر دسترسی را در اندروید راه‌اندازی می‌کند تا ناوبری بدون هندز را ارائه دهد

شرکت‌های هندی تا سال 2027 بیش از 5 میلیارد دلار برای فناوری هوش مصنوعی هزینه خواهند کرد: همه جزئیات

موتورولا Razr، Razr 50 Ultra Design پیش نمایش Surface Online; مشخصات Razr 50 لو رفت: تصاویر را ببینید

دولت در مورد کلاهبرداری های «دستگیری دیجیتالی» هشدار بزرگی صادر می کند – جزئیاتی که باید بدانید

4 ویژگی پیشرفته لپ‌تاپ‌های ویندوزی هنوز نسبت به مک‌بوک‌ها دارند

گوگل چیزی را ارائه کرده است که می تواند بزرگترین محصول سال های اخیر آنها باشد

اپل در حال ارائه یک ویژگی جدید برای کاهش بیماری حرکت برای کاربران آیفون و آیپد است

Samsung Galaxy Z Fold 6 در Geekbench ظاهر می شود. قرار است دوربین های بهتری نسبت به گلکسی اس 24 ارائه دهد

زن ساکن بمبئی به دلیل این کلاهبرداری جدید 54 میلیون روپیه به صورت آنلاین از دست می دهد – تمام جزئیاتی که باید بدانید

نوشته های مشابه

Sora در OpenAI، ElevenLabs و آینده رسانه های ویدیویی

سهام سافت بانک رشد خود را افزایش داد و بیش از 15 درصد پس از سود جهش کرد

واکنش دومینو پس از انتشار پست توئیتری مبنی بر آویزان کردن یک دستمال زننده روی خمیر پیتزا

Samsung Galaxy S23 می تواند شارژ باتری را دور بزند و مستقیماً با برق کار کند

دیدگاهتان را بنویسید لغو پاسخ