Sora در OpenAI، ElevenLabs و آینده رسانه های ویدیویی

2024-02-26

0 8 دقیقه قبل خوانده شده

تکامل سرگرمی های صوتی و تصویری ما را از باردها و سرگرمی های دوره گرد به نمایش های ثابتی که توسط تئاتر رادیویی تکمیل می شود، برده است.

این سرگرمی اصلی عصر ما در کنار تلویزیون بود، ابتدا سیاه و سفید، و سپس، تا حد زیادی به لطف دنیای شگفت انگیز رنگ های دیزنی، تلویزیون های سیاه و سفید با رنگ جایگزین شدند.

سپس تلویزیون از فناوری مبتنی بر CRT و کیفیت استاندارد تا اندازه‌های 25 اینچی به تلویزیون‌های صفحه‌تخت امروزی که عمدتاً 4K هستند و انتظار موج بالقوه 8K را در اواخر این دهه دارند، تغییر مکان داد.

محتوا در تلویزیون تکامل یافته است، از اغلب زنده به برنامه های ضبط شده و از مجموعه ها به محل به تصاویر تولید شده توسط کامپیوتر (CGI). با این حال، برخی مانند دنباله فیلم آینده “Beetlejuice” هنوز ترجیح می دهند از مجموعه ها برای ایجاد یک تصویر ترسناک تر استفاده کنند.

هر مرحله از تکامل تغییرات مهارتی را به همراه داشته است زیرا دوربین ها و فناوری به سطوح مختلف اتوماسیون تکامل یافته اند. اما مهم ترین تغییری که ما انتظار داریم تغییر به محتوای تولید شده توسط هوش مصنوعی است. در این ماه، دو فناوری وارد نسخه بتا شدند: OpenAI's Sora، که ویدیوهای زیبا و واقعی را ایجاد می کند که در حال حاضر صدا ندارند، و تولید کننده صدای AI ElevenLabs که می تواند صدای واقعی ارائه دهد.

Sora's OpenAI همراه با صدای ElevenLabs ما را در چند سال محتوای ویدیویی با کیفیت تولید قرار می دهد. این ویدیوهای ترکیبی تولید شده توسط هوش مصنوعی را که بدون بازیگران، نویسندگان، فیلمبرداران، گرافیست ها و اکثر تیم تولید موجود معمولاً با یک نمایش تلویزیونی یا فیلم مرتبط هستند، بررسی کنید.

در حالی که من انتظار دارم که این فناوری در ابتدا توسط افراد و استودیوهای استارتاپی مورد استفاده قرار گیرد و در درجه اول بر روی آزمایشی ها متمرکز شود، در نهایت بیشتر محتوا چگونه تولید می شود.

بیایید در مورد دنیای سرگرمی پس از هوش مصنوعی صحبت کنیم، همانطور که در نیمه دوم دهه وجود خواهد داشت، به خصوص پس از انقضای اخیر قراردادهای بازیگران و نویسندگان. ما با محصول هفته من، لپ‌تاپ Acer Swift Edge 16، که تعادل تقریباً کاملی بین فناوری و قیمت دارد، به پایان می‌رسانیم.

فهرست مطالب پنهان

دنیای محتوای کاربر محور

گزینه های بیشتر برای سازندگان محتوا و مصرف کنندگان

رویاهای فیلمسازی به حقیقت می پیوندند

خلاصه کردن

لپ تاپ ایسر Swift Edge 16 OLED

دنیای محتوای کاربر محور

اگر به YouTube نگاه کنید، بسیاری از محتوا توسط شرکت‌ها ساخته نمی‌شود، بلکه توسط افراد ساخته می‌شود، برخی با بودجه تولید مناسب.

هوش مصنوعی به ما این امکان را می دهد که حتی با هزینه کمتر محتوای قوی تری ایجاد کنیم و به کاربران اجازه می دهد محتوایی ایجاد کنند که به طور منحصر به فرد برای آنها جالب باشد. تا زمانی که تنظیم‌کننده‌ها به نتیجه برسند و اجرای آن کافی نشود، بدون شک محتوای جعلی بیشتری دریافت خواهیم کرد که واقعی به نظر می‌رسد. با این حال، پول واقعی در تولید محتوایی خواهد بود که برای بسیاری از مردم جذاب باشد و افرادی که آن را تماشا می‌کنند تغییر کنند.

نتیجه نزدیک به #Owlkitty خواهد بود، جایی که یک گربه به محتوای موجود فیلم اضافه می‌شود، اما می‌توانید هر یک از شخصیت‌ها را با هرکس دیگری که می‌خواهید جایگزین کنید – برای مثال فرزندانتان. با این حال، این تنها موج اولیه است. پس از آن، تلاش‌ها را می‌بینم که به دو دسته تقسیم می‌شوند که دوست دارند محتوای ایجاد شده توسط دیگران را اصلاح کنند و کسانی که می‌خواهند محتوایی ایجاد کنند که اصلاح شود.

مطلب پیشنهادی: تیم کوک، مدیر عامل اپل، از طریق یک اپلیکیشن رایگان آیفون برای یک دختر 8 ساله هندی الاصل ایمیلی ارسال کرد.

در حالی که من شک ندارم که متخصصانی که قبلاً از این پیشرفت ناراحت هستند از این تغییر راضی نخواهند بود، اما واقعاً تفاوتی با زمانی که ما به هر شکل دیگری از اتوماسیون نقل مکان کردیم، نیست. کسانی که کار خودکار را انجام می دادند ناراحت بودند زیرا شغلشان به طور چشمگیری تغییر می کرد یا ناپدید می شد.

نتیجه باید تغییری از محتوای ثابت به محتوایی باشد که می‌توان بی‌پایان آن را تغییر داد. اگر پایان یک فیلم را دوست ندارید، می‌توانید آن را تغییر دهید، یا در آینده، سرویس استریم می‌داند چه چیزی را در یک فیلم ترجیح می‌دهید و فیلم‌هایی را ایجاد یا تغییر می‌دهد تا به طور خودکار آن را مطابق علایق شما بهینه کند.

با این حال، در حالی که این کار با نمایشگرهای روی سر کار می‌کند و واقعاً برای محصولاتی مانند Apple Vision Pro مفید است، اما برای گروه‌هایی از افراد با علایق مختلف به خوبی کار نخواهد کرد. در این حالت، سرویس به دنبال نقاط مشترک در گروه می‌گردد و سپس محتوایی را تولید می‌کند که به احتمال زیاد برای بیشترین تعداد افراد در یک گروه یا کسانی که در این مورد نظر دارند – مانند والدین در برابر فرزندان – جذاب باشد.

این رویکرد می تواند پویایی خانوادگی جالبی ایجاد کند یا به طور بالقوه منجر به انزوای بیشتر بین اعضای خانواده شود، زیرا مانند تبلت ها و تلفن های هوشمند امروزی، آنها به صفحه نمایش و محتوای خود فرو می روند و تماشای گروهی هر چیزی جز ورزش به گذشته تبدیل می شود.

ما بدون شک از افرادی که تلاش می‌کنند یا نمی‌توانند یاد بگیرند که چگونه هوش مصنوعی را برای ایجاد محتوای مورد نظر خود یا شخص دیگری هدایت کنند، مزخرفات بیشتری دریافت خواهیم کرد.

دقیقاً مانند اپل که متوجه می‌شود چگونه مجوز موسیقی دیجیتال را صادر کند، برنده احتمالاً شرکتی (و تولیدکنندگان محتوای مرتبط) خواهد بود که نحوه صدور مجوز برای محتوای ویدیویی قابل تغییر را پیدا می‌کند و هزینه آن را به درستی دریافت می‌کند.

من فکر می کنم یوتیوب بهترین شانس را برای انجام این کار دارد، اما فیس بوک و حتی مایکروسافت در رقابت هستند. استیو جابز می‌توانست این را بفهمد، اما من فکر می‌کنم تیم کوک در دیدگاه‌هایش بیش از حد سفت و سخت است و برای درست کردن این موضوع، خلاقیت زیادی لازم است. بنابراین اگرچه اپل ممکن است این کار را انجام دهد، من شک دارم که آنها اولین باشند، و به احتمال زیاد در اینجا از دیگران پیروی می کنند.

گزینه های بیشتر برای سازندگان محتوا و مصرف کنندگان

در سال 1966، وودی آلن فیلمی به نام «چه خبر، لیلی ببر؟» را منتشر کرد، این یک فیلم جاسوسی جدی بود که آلن دوباره آن را به عنوان یک کمدی تصور کرد. اینم یه کلیپ

مطلب پیشنهادی: پخش زنده PKL Pro Kabaddi League 2022 8 اکتبر - triple-panga: تماشای آنلاین

فناوری جدید هوش مصنوعی نه تنها ساخت فیلم هایی مانند Tiger Lily را بسیار آسان تر می کند، بلکه می توان تصاویر بازیگران را به گونه ای تغییر داد که اقدامات و حرکات آنها بیشتر با دیالوگ های جدید مطابقت داشته باشد. شما می توانید به جای فیلمبرداری مجدد، یک فیلم را فقط با دستورالعمل ها کاملاً تغییر دهید. من انتظار دارم که با توجه به ماهیت دیجیتالی منبع، محتوای تولید شده توسط هوش مصنوعی بدون بازیگران زنده آسان تر از محتوای سنتی تر اصلاح شود.

این باعث می‌شود خطوط بین محتوایی مانند بازی‌های ویدیویی، جایی که محتوا را وارد می‌کنید و می‌توانید با آن تعامل داشته باشید، و محتوای ویدیویی سنتی که معمولاً به عنوان مخاطب تماشا می‌کنید، محو شود. فیلم «هاردکور هنری» را به خاطر دارید که اولین فیلم اول شخص فیلمبرداری شد و جالب به نظر می رسید؟ اگرچه، در حالی که درون سر شخصیت اصلی قرار داشتید، نتوانستید نتیجه را تغییر دهید.

هاردکور هنری را تصور کنید که در آن می توانید نتایج را تغییر دهید. آیا این یک بازی ویدیویی نیست؟ ما باید بتوانیم محتوایی ایجاد کنیم که بتوان آن را تماشا کرد و پخش کرد و خطوط بین بازی های ویدیویی و محتوای ویدیویی را به طور غیرقابل برگشتی محو کنیم. در واقع، زمانی که فیلم را تماشا می‌کنید، می‌تواند به محیطی تبدیل شود که در آن تصمیم می‌گیرید که آیا می‌خواهید پروژه ویدیویی را تماشا کنید یا در آن شرکت کنید.

رویاهای فیلمسازی به حقیقت می پیوندند

یکی از پیشرفت‌های جالب و پیش‌بینی‌شده، ترکیب فناوری‌ها برای کمک به مردم برای ایجاد رویاهای شفاف و سپس ترجمه آنها به محتوای ویدیویی مبتنی بر هوش مصنوعی است. تصور کنید بتوانید رویاهای خود را با دیگران به اشتراک بگذارید – یا فقط به عقب برگردید و رویا را دوباره زنده کنید و آن را محقق کنید.

وقتی خواب شفافی می بینم، اغلب قبل از اینکه داستانی که در خواب می بینم کامل شود یا به دلیل رویدادی در خواب که مرا مجبور به بیدار شدن می کند، از خواب بیدار می شوم. این ناامید کننده است. در رختخواب دراز می کشم و سعی می کنم رویای سرم را تمام کنم. حالا تصور کنید که آیا می‌توانید هوش مصنوعی رویاها را برای شما تمام کند، به طوری که نه تنها رویاها را به خاطر می‌آورید، بلکه به دلیل اینکه تمام شده‌اند بسیار کمتر خسته‌کننده هستند.

یک بار داستان کوتاهی در مورد یک شغل نوشتم که آن را «رویاباف» نامیدم. این برای افرادی بود که می‌توانستند رویای فیلم‌های کامل داشته باشند و سپس با کار از طریق یک ناشر، آن آثار را به محتوای قابل فروش تبدیل کنند.

این مفهوم زمانی امکان‌پذیر می‌شود که این فناوری‌های هوش مصنوعی را با تلاش‌هایی برای کمک به مردم برای هدایت و یادآوری رویاهای شفاف ترکیب کنیم.

خلاصه کردن

فناوری‌های آتی که محتوای ویدیویی و صوتی را از داستان‌هایی که ما یا هوش مصنوعی می‌نویسیم ایجاد می‌کنند، به ما حق انتخاب بیشتری در محتوا نسبت به امروز می‌دهند و ایجاد محتوای خوب را به روی مخاطبان گسترده‌تری از سازندگان باز می‌کند.

مطلب پیشنهادی: تحلیلگران می گویند چین ممکن است در سال 2024 با محدودیت های بیشتری برای تراشه روبرو شود

من انتظار دارم افرادی که برای اولین بار نحوه استفاده از این ابزارها را به خوبی یاد می گیرند تا چارچوب هایی را برای کاربران ایجاد کنند تا در آن بازی کنند، بسیار خوب عمل کنند. من همچنین انتظار دارم که این مرحله گذرا باشد، زیرا هوش مصنوعی در حال تکامل است تا نیازهای منحصر به فرد ما را بهتر پیش بینی کند، زیرا ما به سمت تکینگی آینده تکامل می‌یابیم.

تلاش های قابل توجهی برای کاهش سرعت پیشرفت این فناوری انجام خواهد شد. با این حال، من شک دارم که آنها بسیار مؤثر باشند، و نشان می دهد که دنیای محتوا در آینده بیشتر شبیه نسخه آینده YouTube خواهد بود و حتی کمتر شبیه استودیوها و شبکه هایی است که امروز ما را احاطه کرده اند.

مانند همه تغییرات، کسانی که نحوه مدیریت این تغییر و کسب درآمد از آن را درک می کنند، به خوبی عمل خواهند کرد. کسانی که با آن دست و پنجه نرم می کنند، احتمالا نه چندان.

محصول فناوری هفته

لپ تاپ ایسر Swift Edge 16 OLED

لپ تاپ ساید داک 16 اینچی ایسر سویفت اج

(تصویر: ایسر)

در حالی که شرکت‌ها به طور فزاینده‌ای از مردم می‌خواهند که به دفتر بازگردند، بسیاری، اگر نه بیشتر، هنوز اجازه کار از خانه را می‌دهند. این بدان معناست که لپ‌تاپ‌های با صفحه‌نمایش بزرگ‌تر باید برای کسانی که اغلب یا به طور منظم از خانه کار می‌کنند ترجیح داده شوند، زیرا جابه‌جایی مانیتورهای بزرگ در اطراف خانه می‌تواند قدیمی شود – و به این دلیل که وقتی در خانه هستیم، اغلب احساس می‌کنیم که نیاز به تماشای بچه‌ها یا حیوانات داریم. تا آنها را از دردسر دور نگه دارد.

لپ تاپ 16 اینچی برای استفاده در محل کار، خانه یا مدرسه بسیار مناسب است. به اندازه کافی کوچک و سبک است که قابل حمل باشد، اما صفحه نمایش 16 اینچی فضای کافی را فراهم می کند تا به اندازه یک صفحه نمایش کوچکتر احساس خطر نکنید.

از میان لپ‌تاپ‌های 16 اینچی، جالب‌ترین لپ‌تاپ‌هایی که دیده‌ام، Acer Swift Edge 16 است که یکی از اولین NPU‌ها (هوش مصنوعی پیش‌بینی‌کننده دسکتاپ) را به همراه قابلیت‌های CPU و GPU مناسب، همه از AMD دارد که عملکرد قابل‌توجهی داشته است. دیر

این لپ تاپ دارای صفحه نمایش OLED با بیش از یک میلیارد رنگ، سیاهی فوق العاده عمیق و نرخ رفرش 120 هرتز است که برای اکثر بازی ها به اندازه کافی خوب است و مطمئناً برای محتوای ویدیویی (تولید شده با هوش مصنوعی یا نه) عالی است.

نمای جلویی لپ تاپ 16 اینچی ایسر سویفت اج

(تصویر: ایسر)

این لپ‌تاپ با وزن کمتر از 3 پوند، نسبت به اندازه‌اش سبک است و یکی از اولین لپ‌تاپ‌های دارای Wi-Fi 7 است. این لپ‌تاپ دارای تراشه امنیتی Microsoft Pluton است که سطح حفاظتی بالاتری نسبت به اکثر لپ‌تاپ‌های امروزی ارائه می‌کند. Swift Edge 16 با پیکربندی کامل، هنوز کمتر از 1500 دلار است.

یک نقطه ضعف این است که فقط حدود شش ساعت عمر باتری دارد، اما برای یک لپ تاپ ایستگاه به ایستگاه – که همان چیزی است که هنگام کار در دفتر یا خانه که در آن مخاطبین دارید – به آن نیاز دارید – خوب است.

Acer Swift Edge 16 ممکن است لپ تاپ مناسبی برای کسانی باشد که از محل کار و خانه کار می کنند و محصول هفته من است.

2024-02-26

0 8 دقیقه قبل خوانده شده