ویدئوهای هوش مصنوعی گوگل به آینده ای که توسط ماشین تولید می شود اشاره می کند
محققان هوش مصنوعی در Meta Platforms Inc. و گوگل شرکت آلفابت. یک جهش فوق العاده به جلو انجام داد.
توانایی های خلاقانه هوش مصنوعی از مهارت های رانندگی آن پیشی می گیرد. در حالی که فناوری خودروهای خودران راه به جایی نمی برد، انفجار قابل توجهی در تحقیقات پیرامون مدل های مولد یا سیستم های هوش مصنوعی که می توانند تصاویر را از متن ساده ایجاد کنند، رخ داده است. همین هفته گذشته، محققان هوش مصنوعی در Meta Platforms Inc. و گوگل شرکت آلفابت. با توسعه سیستمهایی که میتوانند تقریباً با هر متنی که تصور میشود ویدیو تولید کنند، گامی فوقالعاده به جلو برداشتهاند.
ویدیوهای متا، که مادر فیسبوک است، شبیه به سکانسهای رویایی هستند که خرس عروسکی را در حال نقاشی گلها یا اسبی با پاهای دراز در زمین نشان میدهد. آنها تقریباً یک یا دو ثانیه دوام می آورند و کیفیت نامناسبی دارند که منبع آنها را نشان می دهد، اما همچنان قابل توجه هستند. ویدئوهای تولید شده توسط گوگل از ریختن قهوه در فنجان یا پرواز بر فراز یک کوه برفی بسیار واقعی به نظر می رسد.
گوگل یک سیستم دوم حتی چشمگیرتر به نام Phenaki ایجاد کرده است که می تواند ویدیوهای طولانی تری به مدت دو دقیقه یا بیشتر ایجاد کند. در اینجا نمونه ای از درخواست استفاده شده توسط گوگل برای یکی آورده شده است:
ترافیک زیاد در یک شهر آینده نگر. یک سفینه فضایی بیگانه به شهر آینده نگر می رسد. دوربین وارد سفینه فضایی بیگانگان می شود. دوربین به جلو حرکت می کند تا زمانی که یک فضانورد را در اتاق آبی نشان دهد. فضانورد در حال تایپ کردن روی صفحه کلید است. دوربین از فضانورد دور می شود. فضانورد صفحه کلید را زمین می گذارد و به چپ می رود…”
این کمتر از یک سوم کل اعلان است که تقریباً مانند یک فیلمنامه با دستوراتی مانند “بزرگنمایی دوربین” خوانده می شود. و در اینجا کلیپ حاصل که توسط دومیترو ارهان، یکی از خالقان فناکی در Google Brain در توییتر ارسال شده است:
ممکن است فکر کنید که این پایان هالیوود است که ما آن را می شناسیم، یا هرکسی که چند سلول مغز و یک کامپیوتر داشته باشد به زودی قادر به تولید فیلم های بلند خواهد بود. این در واقع با آنچه محققان امیدوار بودند مطابقت دارد. ارهان در توییتی نوشت که او و تیمش میخواهند به مردم قدرت دهند تا داستانهای بصری خود را بسازند… [to] خلاقیت را برای مردم آسان تر کنید.»
دیدن ویدیوهای تولید شده توسط هوش مصنوعی به این زودی ها به سینمای محلی شما سخت است. اما تقریباً مطمئناً آنها را در فیدهای رسانه های اجتماعی خود خواهیم دید، به ویژه در پلتفرم هایی مانند TikTok شرکت ByteDance Ltd.، Reels اینستاگرام یا YouTube.
TikTok به سؤالی در مورد اینکه آیا در حال ساخت ابزار تولید ویدیوی هوش مصنوعی خود است یا خیر پاسخ نداد، اما منطقی است که این پلتفرم این کار را انجام دهد. کاربران TikTok دوست دارند استیکر، متن و صفحه سبز را به پست های خود اضافه کنند و این پلتفرم با فناوری های جدید به تقاضا پاسخ می دهد. در ماه آگوست، یک تولید کننده تصویر هوش مصنوعی برای ایجاد صفحه نمایش های سبز سبک به برنامه خود اضافه کرد. درخواستی مانند «بوریس جانسون» را وارد کنید و TikTok تصویری انتزاعی را نمایش میدهد که به طور مبهم یادآور نخستوزیر سابق بریتانیا است.
چه اتفاقی میافتد وقتی ماشینها نه تنها ویدیوهایی را توصیه میکنند که ما را در پیمایش نگه میدارند، بلکه دست بزرگتری در ایجاد آنها دارند؟ بسیاری از ما از تماشای فیلمهایی از گربههای بامزه و افرادی که روی خودشان میلنگند لذت میبریم، بنابراین الگوریتمی که میتواند مونتاژهای جعلی از تلو خوردنهای ناخوشایند یا بچه گربههای سریع ایجاد کند، تا زمانی که واقعی به نظر میرسند، بازدیدهای ویروسی را با کمی کار جذب میکند.
سازندگان محتوای TikTok و خود پلتفرمها انگیزهای برای استفاده از ابزاری دارند که میتواند ویدیوها را در مقیاس تولید کند، بهخصوص زمانی که ارزان و آسان باشد. برای بقیه ما، نتیجه فیدهای رسانه های اجتماعی خواهد بود که بیش از همیشه ماشین محور هستند. ویدئوهای هوش مصنوعی که قبلاً توسط هوش مصنوعی و الگوریتمهای توصیهای ارائه شدهاند، به حلقههای بازخورد خود تقویتکنندهای اضافه میکنند که خارشهای شناختی ما را خنثی میکنند.
پیامد احتمالی دیگر سیل اطلاعات نادرست است، اما ممکن است در کوتاه مدت نیاز کمتری به نگرانی در مورد این موضوع وجود داشته باشد. پلتفرمهای رسانههای اجتماعی تلاشها را برای حذف محتوای جعلی افزایش میدهند، و گوگل و فیسبوک هر دو از انتشار ابزارهای ایجاد ویدیو برای عموم خودداری میکنند، زیرا احتمال سوءاستفاده (و احتمالاً روابط عمومی بد) وجود دارد. گوگل گفت که سیستم خود آنها ویدیوهایی را تولید می کند که علیه زنان مغرضانه است، حتی زمانی که آنها سعی می کنند نتایج کلیشه ای را فیلتر کنند. به گفته محققان گوگل، مدل یا کد منبع آن تا زمانی که مشکل برطرف نشود، منتشر نخواهد شد.
البته به لطف سازمان هایی مانند Stability AI به زودی می توانید با محدودیت های کمی از این ابزارها استفاده کنید. این استارت آپ بریتانیایی در آگوست گذشته ابزاری برای تولید تصویر راه اندازی کرد که به هر کسی اجازه می داد آثار هنری جالب و همچنین عکس های جعلی از افراد مشهور، سیاستمداران و مناطق جنگی تولید کند، چیزی که شرکت های بزرگتر هوش مصنوعی ممنوع کرده اند. من این ابزار را آزمایش کردم و در عرض چند ثانیه توانستم عکسهای دونالد ترامپ، رئیس جمهور سابق آمریکا را در حال بازی گلف با رهبر کره شمالی، کیم جونگ اون، تهیه کنم. Stability در حال کار بر روی یک ابزار تولید ویدیو است که قصد دارد پس از آماده شدن آن را به صورت عمومی منتشر کند.
اما در حالی که دسترسی بیشتر به چنین ابزارهایی منجر به محتوای جعلی بیشتر می شود، به این معنی است که افراد بیشتری از وجود ابزارها آگاه هستند. آنها به احتمال زیاد مشکوک هستند که “عکس” رئیس جمهور جو بایدن در حال مشت زدن به یک خانم مسن توسط هوش مصنوعی ایجاد شده است. با این حال، این امید است.
به همان اندازه نگران کننده این است که این ابزارها با رژیم غذایی روزانه مردم چه می کنند. محققان گوگل ادعا می کنند که ابزار آنها خلاقیت انسان را افزایش می دهد. اما وقتی ساختن یک ویدیو آنقدر آسان می شود که به سختی لازم است به آن فکر کنید، آیا واقعاً تخیل ما را مهار می کند؟ شاید در هر موردی نه.
همراه با موتورهای ارجاعی که بسیاری از آنچه را که ما آنلاین دیدهایم با هدف ایجاد کلیک هدایت میکنند، آینده ما را بسیار ماشینمحورتر و شاید نه چندان خلاقانهتر نشان میدهد.
پارمی اولسون ستون نویس فناوری Bloomberg Opinion است. او خبرنگار سابق وال استریت ژورنال و فوربس، نویسنده کتاب ما ناشناس هستیم.