Sora در OpenAI، ElevenLabs و آینده رسانه های ویدیویی
تکامل سرگرمی های صوتی و تصویری ما را از باردها و سرگرمی های دوره گرد به نمایش های ثابتی که توسط تئاتر رادیویی تکمیل می شود، برده است.
این سرگرمی اصلی عصر ما در کنار تلویزیون بود، ابتدا سیاه و سفید، و سپس، تا حد زیادی به لطف دنیای شگفت انگیز رنگ های دیزنی، تلویزیون های سیاه و سفید با رنگ جایگزین شدند.
سپس تلویزیون از فناوری مبتنی بر CRT و کیفیت استاندارد تا اندازههای 25 اینچی به تلویزیونهای صفحهتخت امروزی که عمدتاً 4K هستند و انتظار موج بالقوه 8K را در اواخر این دهه دارند، تغییر مکان داد.
محتوا در تلویزیون تکامل یافته است، از اغلب زنده به برنامه های ضبط شده و از مجموعه ها به محل به تصاویر تولید شده توسط کامپیوتر (CGI). با این حال، برخی مانند دنباله فیلم آینده “Beetlejuice” هنوز ترجیح می دهند از مجموعه ها برای ایجاد یک تصویر ترسناک تر استفاده کنند.
هر مرحله از تکامل تغییرات مهارتی را به همراه داشته است زیرا دوربین ها و فناوری به سطوح مختلف اتوماسیون تکامل یافته اند. اما مهم ترین تغییری که ما انتظار داریم تغییر به محتوای تولید شده توسط هوش مصنوعی است. در این ماه، دو فناوری وارد نسخه بتا شدند: OpenAI's Sora، که ویدیوهای زیبا و واقعی را ایجاد می کند که در حال حاضر صدا ندارند، و تولید کننده صدای AI ElevenLabs که می تواند صدای واقعی ارائه دهد.
Sora's OpenAI همراه با صدای ElevenLabs ما را در چند سال محتوای ویدیویی با کیفیت تولید قرار می دهد. این ویدیوهای ترکیبی تولید شده توسط هوش مصنوعی را که بدون بازیگران، نویسندگان، فیلمبرداران، گرافیست ها و اکثر تیم تولید موجود معمولاً با یک نمایش تلویزیونی یا فیلم مرتبط هستند، بررسی کنید.
در حالی که من انتظار دارم که این فناوری در ابتدا توسط افراد و استودیوهای استارتاپی مورد استفاده قرار گیرد و در درجه اول بر روی آزمایشی ها متمرکز شود، در نهایت بیشتر محتوا چگونه تولید می شود.
بیایید در مورد دنیای سرگرمی پس از هوش مصنوعی صحبت کنیم، همانطور که در نیمه دوم دهه وجود خواهد داشت، به خصوص پس از انقضای اخیر قراردادهای بازیگران و نویسندگان. ما با محصول هفته من، لپتاپ Acer Swift Edge 16، که تعادل تقریباً کاملی بین فناوری و قیمت دارد، به پایان میرسانیم.
دنیای محتوای کاربر محور
اگر به YouTube نگاه کنید، بسیاری از محتوا توسط شرکتها ساخته نمیشود، بلکه توسط افراد ساخته میشود، برخی با بودجه تولید مناسب.
هوش مصنوعی به ما این امکان را می دهد که حتی با هزینه کمتر محتوای قوی تری ایجاد کنیم و به کاربران اجازه می دهد محتوایی ایجاد کنند که به طور منحصر به فرد برای آنها جالب باشد. تا زمانی که تنظیمکنندهها به نتیجه برسند و اجرای آن کافی نشود، بدون شک محتوای جعلی بیشتری دریافت خواهیم کرد که واقعی به نظر میرسد. با این حال، پول واقعی در تولید محتوایی خواهد بود که برای بسیاری از مردم جذاب باشد و افرادی که آن را تماشا میکنند تغییر کنند.
نتیجه نزدیک به #Owlkitty خواهد بود، جایی که یک گربه به محتوای موجود فیلم اضافه میشود، اما میتوانید هر یک از شخصیتها را با هرکس دیگری که میخواهید جایگزین کنید – برای مثال فرزندانتان. با این حال، این تنها موج اولیه است. پس از آن، تلاشها را میبینم که به دو دسته تقسیم میشوند که دوست دارند محتوای ایجاد شده توسط دیگران را اصلاح کنند و کسانی که میخواهند محتوایی ایجاد کنند که اصلاح شود.
در حالی که من شک ندارم که متخصصانی که قبلاً از این پیشرفت ناراحت هستند از این تغییر راضی نخواهند بود، اما واقعاً تفاوتی با زمانی که ما به هر شکل دیگری از اتوماسیون نقل مکان کردیم، نیست. کسانی که کار خودکار را انجام می دادند ناراحت بودند زیرا شغلشان به طور چشمگیری تغییر می کرد یا ناپدید می شد.
نتیجه باید تغییری از محتوای ثابت به محتوایی باشد که میتوان بیپایان آن را تغییر داد. اگر پایان یک فیلم را دوست ندارید، میتوانید آن را تغییر دهید، یا در آینده، سرویس استریم میداند چه چیزی را در یک فیلم ترجیح میدهید و فیلمهایی را ایجاد یا تغییر میدهد تا به طور خودکار آن را مطابق علایق شما بهینه کند.
با این حال، در حالی که این کار با نمایشگرهای روی سر کار میکند و واقعاً برای محصولاتی مانند Apple Vision Pro مفید است، اما برای گروههایی از افراد با علایق مختلف به خوبی کار نخواهد کرد. در این حالت، سرویس به دنبال نقاط مشترک در گروه میگردد و سپس محتوایی را تولید میکند که به احتمال زیاد برای بیشترین تعداد افراد در یک گروه یا کسانی که در این مورد نظر دارند – مانند والدین در برابر فرزندان – جذاب باشد.
این رویکرد می تواند پویایی خانوادگی جالبی ایجاد کند یا به طور بالقوه منجر به انزوای بیشتر بین اعضای خانواده شود، زیرا مانند تبلت ها و تلفن های هوشمند امروزی، آنها به صفحه نمایش و محتوای خود فرو می روند و تماشای گروهی هر چیزی جز ورزش به گذشته تبدیل می شود.
ما بدون شک از افرادی که تلاش میکنند یا نمیتوانند یاد بگیرند که چگونه هوش مصنوعی را برای ایجاد محتوای مورد نظر خود یا شخص دیگری هدایت کنند، مزخرفات بیشتری دریافت خواهیم کرد.
دقیقاً مانند اپل که متوجه میشود چگونه مجوز موسیقی دیجیتال را صادر کند، برنده احتمالاً شرکتی (و تولیدکنندگان محتوای مرتبط) خواهد بود که نحوه صدور مجوز برای محتوای ویدیویی قابل تغییر را پیدا میکند و هزینه آن را به درستی دریافت میکند.
من فکر می کنم یوتیوب بهترین شانس را برای انجام این کار دارد، اما فیس بوک و حتی مایکروسافت در رقابت هستند. استیو جابز میتوانست این را بفهمد، اما من فکر میکنم تیم کوک در دیدگاههایش بیش از حد سفت و سخت است و برای درست کردن این موضوع، خلاقیت زیادی لازم است. بنابراین اگرچه اپل ممکن است این کار را انجام دهد، من شک دارم که آنها اولین باشند، و به احتمال زیاد در اینجا از دیگران پیروی می کنند.
گزینه های بیشتر برای سازندگان محتوا و مصرف کنندگان
در سال 1966، وودی آلن فیلمی به نام «چه خبر، لیلی ببر؟» را منتشر کرد، این یک فیلم جاسوسی جدی بود که آلن دوباره آن را به عنوان یک کمدی تصور کرد. اینم یه کلیپ
فناوری جدید هوش مصنوعی نه تنها ساخت فیلم هایی مانند Tiger Lily را بسیار آسان تر می کند، بلکه می توان تصاویر بازیگران را به گونه ای تغییر داد که اقدامات و حرکات آنها بیشتر با دیالوگ های جدید مطابقت داشته باشد. شما می توانید به جای فیلمبرداری مجدد، یک فیلم را فقط با دستورالعمل ها کاملاً تغییر دهید. من انتظار دارم که با توجه به ماهیت دیجیتالی منبع، محتوای تولید شده توسط هوش مصنوعی بدون بازیگران زنده آسان تر از محتوای سنتی تر اصلاح شود.
این باعث میشود خطوط بین محتوایی مانند بازیهای ویدیویی، جایی که محتوا را وارد میکنید و میتوانید با آن تعامل داشته باشید، و محتوای ویدیویی سنتی که معمولاً به عنوان مخاطب تماشا میکنید، محو شود. فیلم «هاردکور هنری» را به خاطر دارید که اولین فیلم اول شخص فیلمبرداری شد و جالب به نظر می رسید؟ اگرچه، در حالی که درون سر شخصیت اصلی قرار داشتید، نتوانستید نتیجه را تغییر دهید.
هاردکور هنری را تصور کنید که در آن می توانید نتایج را تغییر دهید. آیا این یک بازی ویدیویی نیست؟ ما باید بتوانیم محتوایی ایجاد کنیم که بتوان آن را تماشا کرد و پخش کرد و خطوط بین بازی های ویدیویی و محتوای ویدیویی را به طور غیرقابل برگشتی محو کنیم. در واقع، زمانی که فیلم را تماشا میکنید، میتواند به محیطی تبدیل شود که در آن تصمیم میگیرید که آیا میخواهید پروژه ویدیویی را تماشا کنید یا در آن شرکت کنید.
رویاهای فیلمسازی به حقیقت می پیوندند
یکی از پیشرفتهای جالب و پیشبینیشده، ترکیب فناوریها برای کمک به مردم برای ایجاد رویاهای شفاف و سپس ترجمه آنها به محتوای ویدیویی مبتنی بر هوش مصنوعی است. تصور کنید بتوانید رویاهای خود را با دیگران به اشتراک بگذارید – یا فقط به عقب برگردید و رویا را دوباره زنده کنید و آن را محقق کنید.
وقتی خواب شفافی می بینم، اغلب قبل از اینکه داستانی که در خواب می بینم کامل شود یا به دلیل رویدادی در خواب که مرا مجبور به بیدار شدن می کند، از خواب بیدار می شوم. این ناامید کننده است. در رختخواب دراز می کشم و سعی می کنم رویای سرم را تمام کنم. حالا تصور کنید که آیا میتوانید هوش مصنوعی رویاها را برای شما تمام کند، به طوری که نه تنها رویاها را به خاطر میآورید، بلکه به دلیل اینکه تمام شدهاند بسیار کمتر خستهکننده هستند.
یک بار داستان کوتاهی در مورد یک شغل نوشتم که آن را «رویاباف» نامیدم. این برای افرادی بود که میتوانستند رویای فیلمهای کامل داشته باشند و سپس با کار از طریق یک ناشر، آن آثار را به محتوای قابل فروش تبدیل کنند.
این مفهوم زمانی امکانپذیر میشود که این فناوریهای هوش مصنوعی را با تلاشهایی برای کمک به مردم برای هدایت و یادآوری رویاهای شفاف ترکیب کنیم.
خلاصه کردن
فناوریهای آتی که محتوای ویدیویی و صوتی را از داستانهایی که ما یا هوش مصنوعی مینویسیم ایجاد میکنند، به ما حق انتخاب بیشتری در محتوا نسبت به امروز میدهند و ایجاد محتوای خوب را به روی مخاطبان گستردهتری از سازندگان باز میکند.
من انتظار دارم افرادی که برای اولین بار نحوه استفاده از این ابزارها را به خوبی یاد می گیرند تا چارچوب هایی را برای کاربران ایجاد کنند تا در آن بازی کنند، بسیار خوب عمل کنند. من همچنین انتظار دارم که این مرحله گذرا باشد، زیرا هوش مصنوعی در حال تکامل است تا نیازهای منحصر به فرد ما را بهتر پیش بینی کند، زیرا ما به سمت تکینگی آینده تکامل مییابیم.
تلاش های قابل توجهی برای کاهش سرعت پیشرفت این فناوری انجام خواهد شد. با این حال، من شک دارم که آنها بسیار مؤثر باشند، و نشان می دهد که دنیای محتوا در آینده بیشتر شبیه نسخه آینده YouTube خواهد بود و حتی کمتر شبیه استودیوها و شبکه هایی است که امروز ما را احاطه کرده اند.
مانند همه تغییرات، کسانی که نحوه مدیریت این تغییر و کسب درآمد از آن را درک می کنند، به خوبی عمل خواهند کرد. کسانی که با آن دست و پنجه نرم می کنند، احتمالا نه چندان.
لپ تاپ ایسر Swift Edge 16 OLED
(تصویر: ایسر)
در حالی که شرکتها به طور فزایندهای از مردم میخواهند که به دفتر بازگردند، بسیاری، اگر نه بیشتر، هنوز اجازه کار از خانه را میدهند. این بدان معناست که لپتاپهای با صفحهنمایش بزرگتر باید برای کسانی که اغلب یا به طور منظم از خانه کار میکنند ترجیح داده شوند، زیرا جابهجایی مانیتورهای بزرگ در اطراف خانه میتواند قدیمی شود – و به این دلیل که وقتی در خانه هستیم، اغلب احساس میکنیم که نیاز به تماشای بچهها یا حیوانات داریم. تا آنها را از دردسر دور نگه دارد.
لپ تاپ 16 اینچی برای استفاده در محل کار، خانه یا مدرسه بسیار مناسب است. به اندازه کافی کوچک و سبک است که قابل حمل باشد، اما صفحه نمایش 16 اینچی فضای کافی را فراهم می کند تا به اندازه یک صفحه نمایش کوچکتر احساس خطر نکنید.
از میان لپتاپهای 16 اینچی، جالبترین لپتاپهایی که دیدهام، Acer Swift Edge 16 است که یکی از اولین NPUها (هوش مصنوعی پیشبینیکننده دسکتاپ) را به همراه قابلیتهای CPU و GPU مناسب، همه از AMD دارد که عملکرد قابلتوجهی داشته است. دیر
این لپ تاپ دارای صفحه نمایش OLED با بیش از یک میلیارد رنگ، سیاهی فوق العاده عمیق و نرخ رفرش 120 هرتز است که برای اکثر بازی ها به اندازه کافی خوب است و مطمئناً برای محتوای ویدیویی (تولید شده با هوش مصنوعی یا نه) عالی است.
(تصویر: ایسر)
این لپتاپ با وزن کمتر از 3 پوند، نسبت به اندازهاش سبک است و یکی از اولین لپتاپهای دارای Wi-Fi 7 است. این لپتاپ دارای تراشه امنیتی Microsoft Pluton است که سطح حفاظتی بالاتری نسبت به اکثر لپتاپهای امروزی ارائه میکند. Swift Edge 16 با پیکربندی کامل، هنوز کمتر از 1500 دلار است.
یک نقطه ضعف این است که فقط حدود شش ساعت عمر باتری دارد، اما برای یک لپ تاپ ایستگاه به ایستگاه – که همان چیزی است که هنگام کار در دفتر یا خانه که در آن مخاطبین دارید – به آن نیاز دارید – خوب است.
Acer Swift Edge 16 ممکن است لپ تاپ مناسبی برای کسانی باشد که از محل کار و خانه کار می کنند و محصول هفته من است.