دوقلوهای دیجیتال کار و آینده سرگرمی های ویدیویی
سرعت پیشرفت هوش مصنوعی باورنکردنی است. قبل از پایان سال گذشته، بسیاری از ما فکر میکردیم که هوش مصنوعی تا چندین سال دیگر بهصورت جداگانه مفید نخواهد بود. سپس ChatGPT با فناوری GPT-3 و بهسرعت GPT-4 مورد استفاده قرار گرفت و ناگهان با هوش مصنوعی احاطه شدیم که میتواند بهرهوری ما را بهبود بخشد.
یکی از جالبترین آنها، مدل هوش مصنوعی ترکیبی ویدئویی از DeepBrain AI است که میتواند یک دوقلوی دیجیتالی کارآمد از فردی ایجاد کند که به طور فزایندهای میتواند وظایفی را که فرد بازتابی معمولاً باید انجام دهد، به عهده بگیرد.
بیایید در مورد ظهور دوقلو دیجیتال مفید انسان در این هفته صحبت کنیم. ما با محصول هفته من، لنوو موتورولا ThinkPhone، گوشی هوشمندی که یکی از بزرگترین اشتباهات صنعت رایانه شخصی را در واکنش شدید خود به آیفون اپل برطرف می کند، کار را به پایان خواهیم رساند.
مدل های هوش مصنوعی برای سنتز ویدئو
هوش مصنوعی DeepBrain که در ابتدا بر روی استعداد مجری اخبار متمرکز بود، اولین دوقلو دیجیتال انسانی است که من به آن نگاه کردم که می تواند وظایف را به روشی غیرقابل تشخیص از انسان انجام دهد.
این دوقلو دیجیتال با امکان یادگیری از چندین ویدیوی خبری برای ایجاد پایگاه داده ای از دانش درباره رفتار، خصلت ها، گفتار و حرکات مجری ایجاد شد.
دوقلوی دیجیتالی به دست آمده را میتوان با یک فیلمنامه تغذیه کرد و از آن متن مانند یک گوینده خبر عمل میکند. یک دوقلوی دیجیتالی جایگزین استعدادهای انسانی نیست، و استعدادها معمولاً هر زمان که یک سرویس خبری از آن آواتار استفاده میکند، جبران میشود، بیشتر برای اخبار فوری یا طعنههای کوتاه برای برنامههای زنده آینده.
گاهی اوقات سرویس های خبری متوجه می شوند که مخاطب در حال تماشای آواتار تولید شده توسط هوش مصنوعی است. در جایی که این فناوری در حال حاضر مورد استفاده قرار می گیرد، توسط مخاطبان خبری و استعدادها پذیرفته شده است.
دلیل موافقت استعدادهای خبری با این موضوع این است که هنگام استفاده از آواتار پاداش دریافت میکنند و استفاده از آواتار به این معنی است که استعدادها مجبور نیستند برای ضبط یا ضبط بخشهای کوتاه زنده، بهروزرسانیها یا اطلاعیههایی که معمولاً به آنها نیاز دارند، به استودیو بروند. برای بازگشت به استودیو
بنابراین آواتار به درآمد آنها لطمه ای وارد نمی کند و با کاهش حجم کاری و تشدید ناشی از آن، کار افراد را تکمیل می کند، که همه اینها باید رضایت شغلی را بهبود بخشد.
موارد استفاده از آواتار
در حالی که بیشتر موارد استفاده اولیه از این فناوری برای برنامههای خبری ویدیویی است که در آن آواتار و گوینده خبر قابل تشخیص نیستند (مثلاً در آسیا)، برنامههای کاربردی دیگر عبارتند از:
- کیوسک های مجازی در بانک ها که به نظر می رسد با یک انسان صحبت می کنید، اما در عوض با یک هوش مصنوعی صحبت می کنید.
- ویدیوهای آموزشی یک طرفه که بر روی یک اسکریپت نوشته شده اجرا می شوند
- دربان هتل مجازی که می تواند در مواردی مانند رزرو رستوران یا بلیط نمایش کمک کند
- ویدیوهای تعاملی که بار دیگر احساس می کنید در حال صحبت با یک فرد زنده هستید
برخی از این آواتارها هرگز افراد واقعی نبودند. آنها تصاویری بسیار واقعی و با کامپیوتر تولید شده بودند.
مزایای هزینه قابل توجه است، زیرا معمولاً حدود 4000 دلار برای ایجاد یک قطعه از این محتوای کوتاه با یک شخص زنده هزینه دارد، اما فقط حدود 100 دلار هزینه دارد تا همین کار را با یک آواتار تولید شده توسط رایانه انجام دهید.
آواتار نیازی به تمرین ندارد و بدون حواسپرتی مانند بیماری یا هر یک از درگیریها یا مسائل رفتاری که معمولاً با استعدادهای زنده مرتبط است، از روی متن نوشته شده کار میکند.
با توجه به اینکه آواتار از روی متن کار میکند، میتوان آن را توسط هوش مصنوعی دیگری مانند ChatGPT یا واتسون IBM کنترل کرد، که سطحی از محتوای تعاملی انسانی را ایجاد کردهاند که میتواند بسیاری از افراد را فریب دهد تا فکر کنند با یک فرد زنده صحبت میکنند.
یکی دیگر از کاربردهای مورد مطالعه، حمایت از افراد مشهور است:
سلبریتی ها به خوبی مقیاس نمی شوند زیرا اگر از آنها به عنوان مدافع استفاده کنید، توانایی افراد برای صحبت با آنها تقریباً وجود ندارد. با این حال، آواتار افراد مشهور علاوه بر مشتریان فعلی یا آینده مشتری، میتواند با طرفداران در مقیاس بزرگ تعامل داشته باشد.
همانطور که اشاره شد، این فناوری میتواند افراد واقعی و شخصیتهای خلق شده هنری را اسکن کند، که میتواند برخی از مشکلات شرکتهایی مانند مکدونالد (رونالد مکدونالد)، کنتاکی فرید چیکن، و جک در جعبه را با استفاده از افراد زنده که همه بازیگران در آن حضور خواهند داشت، حل کند. به طور مرتب تغییر می کند تا بازیگر آنقدر با شخصیت مرتبط نباشد که نتوان آنها را جایگزین کرد.
با یک آواتار دیجیتالی ایجاد شده، این شرکت مالک بازیگر مجازی است و با حذف انسانها از ترکیب، مشکلات ناشی از انسان از بین میرود.
انسان و دوقلوهای دیجیتال مجازی – چه چیزی در آینده است
تمرکز فعلی DeepBrain در بیشتر موارد بر تقویت و نه جایگزینی انسان است. با این حال، استفاده آنها از آواتارهای کاملاً سنتز شده که هیچ ارتباطی با هیچ انسانی ندارند، بیشتر یک جایگزین است تا یک مدل بهبود. اگرچه در ابتدا بر روی محتوای کوتاه مدت متمرکز بود، اما هیچ چیز مانع از حرکت این فناوری به تولیدات بلندمدت مانند برنامه های تلویزیونی و فیلم ها نمی شود.
ماهیت بیش از حد واقع گرایانه آواتارها با آموزش بیشتر و با پیشرفت فناوری، حتی در فرم طولانی، بهبود می یابد. بازیگران مجازی از افراد واقعی غیرقابل تشخیص خواهند بود، حتی اگر آنها ملغمهای از آن افراد باشند، مشابه محصولاتی مانند Dalle-E که هنر را از آمیزهای از تصاویر میسازند.
با توجه به مزیت های هنگفت استفاده از محتوای ایجاد شده مجازی نسبت به اکشن زنده، پتانسیل فناوری مانند این برای ایجاد اختلال در صنعت رسانه قابل توجه است. با نگاه کردن به آینده، فقط هزینه استعداد نیست که از آن اجتناب می شود. کل هزینه استودیویی که استعداد در غیر این صورت در آن بازی می کرد نیز می تواند حذف شود.
از آنجایی که GPT-4 در حال حاضر کار جالبی با فیلمنامهها و داستانها انجام میدهد، میتوانید این را در نقشه راه برای فیلمها و برنامههای تلویزیونی واقعی واقعی قرار دهید که کاملاً توسط هوش مصنوعی بر اساس ترجیحات کاربر ایجاد شدهاند.
در نهایت، به جای تماشای برنامه و فیلم تلویزیونی مشابه دیگران، این فناوری همراه با هوش مصنوعی مولد میتواند ویدیوهای شخصیسازی شده در مقیاس ایجاد کند و به طور بالقوه شما و خانوادهتان را به عنوان بازیگران اصلی قرار دهد (البته با اجازه شما).
البته، سپس میتوانید آن ویدیوها را در رسانههای اجتماعی با کسانی که علاقهمند به دیدن آنچه دیگران ایجاد میکنند به اشتراک بگذارید، به طور بالقوه حجم عظیمی از محتوای منحصربهفرد ایجاد کنید که خدمات برای تجزیه و تحلیل و ارائه آن به دنیایی از مشتریان بالقوه نیاز دارند.
خلاصه کردن
اینکه بتوانید دوقلو خود را برای انجام برخی از کارهای خود که در حال حاضر هوش مصنوعی DeepBrain روی آن متمرکز شده است، ایجاد کنید، یک تغییر بازی است. اما وقتی بتوانیم تصاویر ترکیبی بگیریم و همین کار را انجام دهیم، مخصوصاً برای محتوای طولانی، به شدت همه اشکال سرگرمی را مختل می کند. به عنوان مثال، صنعت پورن در حال حاضر در این مورد همه جا را فرا گرفته است. محتوای Reddit مدتی است که این کار را انجام میدهد و به نظر میرسد اکثر کاربران اهمیتی نمیدهند.
همه چیز، از شخصیتهای غیربازیکن (NPC) که به عنوان افراد واقعی ظاهر میشوند، تا توانایی ساخت تیمهای ورزشی مجازی کامل با نمایش دقیق بازیکنان واقعی، خیالی یا حتی مرده، همگی به طور بالقوه روی میز هستند، و همه نشاندهنده سطحی از اختلالی که ما تازه داریم می بینیم.
به طور خلاصه، تشخیص اینکه چه چیزی واقعی است و چه چیزی نیست دشوار است و این دشواری فقط افزایش خواهد یافت. وقتی صحبت از سرگرمی به میان میآید، این میتواند چیز خوبی باشد، اما وقتی صحبت از توانایی ما برای دیدن حقیقت میشود، میتواند تاثیر بسیار مشکلسازتری داشته باشد. ما اصلا برای این کار آماده نیستیم.
Lenovo ThinkPhone توسط موتورولا
یکی از بزرگترین اشتباهات صنعت کامپیوتر، تمرکز کامل روی آیفون بود. طنز این بود که صنعت در ابتدا به یک گوشی هوشمند متمرکز بر مصرف کننده اعتقاد نداشت. سپس، به جای مبارزه با این روند بر اساس شایستگی های خود، سعی کرد آیفون را بچرخاند تا اپل ظاهراً یک شبه از یک تازه وارد به رهبر بازار تبدیل شود.
اولین بار نبود که این اتفاق می افتاد. چند دهه قبل، IBM سعی کرد به سمت محاسبات مشتری/سرور حرکت کند و تقریباً پردازنده مرکزی را رها کرد و در چند سال آن را از یک رهبر بلامنازع بازار به تقریباً از بین برد.
امروزه، بازار گوشی های هوشمند متمرکز بر کسب و کار مورد استفاده قرار نمی گیرد. من یک بار با مدیر عامل وقت بانک آمریکا صحبت کردم که نمی خواست مردمش از تلفن های مصرفی استفاده کنند. او چیزی ایمن و تجاریمحور مانند بلکبری قدیمی میخواست، اما از اینکه کسی چنین دستگاهی را ایجاد نکرده بود، ناامید شد.
خب، لنوو به تازگی این مشکل را با ThinkPhone نمادین خود برطرف کرده است.
Lenovo ThinkPhone توسط Motorola (تصویر: Lenovo)
ThinkPhone بر اساس نام تجاری ThinkPad بسیار متمرکز بر تجارت که از IBM نشات گرفته است، ابعادی مشابه آیفون دارد، اما دارای چندین ویژگی منحصر به فرد متمرکز بر تجارت است.
این ویژگی ها عبارتند از:
- اتصال فوری: تلفن و رایانه شخصی به طور یکپارچه تشخیص می دهند که چه زمانی در نزدیکی هستند و از طریق Wi-Fi به آن متصل می شوند.
- کلیپ بورد یکپارچه: متن کپی شده یا عکسهای اخیر، اسناد اسکن شده و ویدیوها را با چسباندن آنها در هر برنامهای در دستگاه مورد نظر، بهطور یکپارچه بین دستگاهها انتقال دهید.
- اطلاعیه های تلفیقی: اعلان های تلفن بلافاصله در مرکز اقدام ویندوز ظاهر می شوند. با کلیک بر روی یک اعلان، برنامه تلفن مربوطه به طور خودکار روی صفحه رایانه راه اندازی می شود.
- پخش یک فایل: به راحتی فایل ها را بین ThinkPhone و PC بکشید و رها کنید.
- پخش برنامه: هر برنامه اندرویدی را مستقیماً روی رایانه شخصی باز کنید.
- وب کم پیشرفته: از دوربینهای قدرتمند ThinkPhone و قابلیتهای هوش مصنوعی بهره ببرید تا بهطور یکپارچه از آن بهعنوان وبکم برای همه تماسهای ویدیویی خود استفاده کنید. چرا یک وب کم جداگانه بخرید در حالی که از قبل دوربین بهتری در تلفن هوشمند خود دارید؟
- نقطه اتصال فوری: با یک کلیک مستقیم از رایانه خود به اینترنت متصل شوید تا از قابلیت اتصال 5G ThinkPhone استفاده کنید. این بسیار بزرگ است و به طور بالقوه نیاز و هزینه قابلیت WAN را در رایانه شما کاهش می دهد.
مانند ThinkPad، ThinkPhone به دلیل استفاده از الیاف آرامید (مورد استفاده در زره بدن)، آلومینیوم درجه هواپیما و Victus، سختترین محلول گوریلا گلس، از لحاظ امنیتی پیچیده شده و مطابق با استاندارد نظامی 810H (MIL-STD-810H) آزمایش شده است.
ThinkPhone تا عمق 1.5 متری تا 30 دقیقه ضد آب است. حتی یک دکمه قرمز برای راه اندازی یک برنامه مهم وجود دارد. من معمولاً دوربین را انتخاب میکنم زیرا این همان چیزی است که اغلب به آن نیاز دارم. دیگران میتوانند از آن برای استقرار مجدد Push-to-Talk برای پلیس، امنیت و سایر برنامههایی که ارتباط فوری حیاتی است استفاده کنند (این مورد در برنامه مایکروسافت Teams Walkie Talkie پشتیبانی میشود).
ThinkPhone که برای کنترل از راه دور طراحی شده است، می تواند به صورت مرکزی پیکربندی و مدیریت شود تا مطمئن شود که دستگاه ایمن است و مورد سوء استفاده قرار نمی گیرد، که یک نیاز معمول برای یک دستگاه محاسباتی کسب و کار محور است. ThinkPhone یک پردازنده منحصر به فرد به نام Moto Secure دارد که پینها، گذرواژهها و کلیدهای رمزنگاری را ایزوله میکند و آنها را در محیطی بدون دستکاری نگه میدارد تا بازیگران بد نتوانند به آنها دسترسی داشته باشند.
ThinkPhone دارای یک شارژر جهانی منحصر به فرد و بسیار کوچک 68 واتی است که گوشی را در عرض چند دقیقه شارژ می کند و همچنین به اندازه کافی قدرتمند است که بتواند اکثر لپ تاپ های تجاری یا سایر دستگاه های USB-C را تامین کند – اما نه ماشین های بازی یا ایستگاه های کاری.
در نهایت، این تلفن دارای یک دوربین 50 مگاپیکسلی با کیفیت بالا است که باید اکثر نیازهای عکس را پوشش دهد، چه برای ثبت یک رویداد شخصی، چه برای یک محقق بیمه یا شخص دیگری که نیاز به ایجاد یک ضبط با کیفیت بالا دارد.
ThinkPhone خلأ تلفن های تجاری را که از زمان خروج بلک بری و پالم از بازار وجود داشته است، پر می کند و محصول هفته من است.