افکت تماس چشمی Nvidia یک تغییر دهنده بازی برای سازندگان ویدیو است
کنفرانسهای ویدیویی، پادکستها و وبینارها در طول سالهای همهگیری سالهای 2020 و 2021 محبوبیت پیدا کردند، زیرا کار از راه دور به بخشی از معمول جدید تبدیل شد. با این همه گیری اکنون در آینه دید عقب، تکنیک های ارتباط ویدیویی هیچ نشانه ای از کاهش سرعت را نشان نمی دهند.
چیزی که برای من جالب بود این است که، علیرغم فراگیر بودن ارتباطات ویدیویی، چقدر ناخوشایند به نظر میرسیم که اغلب در دوربین با استفاده از وبکمهای کم قدرت و وضوح پایین به نظر میرسیم، توجه بسیار کمی به ما میشود. نور ضعیف، به ویژه هنگام استفاده از تماس های ویدیویی از خانه، بدون شک یک مشکل بزرگ است. وبکمهای با وضوح پایین HD که در اکثر لپتاپها، حتی لپتاپهای پیشرفته، تعبیه شده است، کمکی نمیکنند.
بدون داراییهای حرفهای موجود در یک استودیوی تلویزیونی حرفهای، سیاستمداران، افراد مشهور و کارشناسان صنعت اغلب وقتی از راه دور از خانههایشان مصاحبه میکنند، وحشتناک به نظر میرسند.
کنفرانس ویدیویی روتین از خانه به ویژه در برابر ظاهر و احساس “ساعت آماتور” آسیب پذیر است، به خصوص در طول ارائه رسمی که در آن یک چشم سرگردان (مثلاً مستقیماً به وب کم نگاه نمی کند) می تواند حواس بیننده را پرت کند.
محل قرارگیری وبکم مسئول این اثر ناخواسته است، زیرا دوربین معمولاً در قسمت بالایی پنل لپتاپ یا روی یک پایه جداگانه قرار میگیرد که قرار دادن آن در مقابل نمایشگر دسکتاپ دشوار است.
از آنجایی که یک کنفرانس ویدئویی معمولی با استفاده از رایانه رومیزی یا لپ تاپ دارای عملکرد تله پرومتر مناسب نیست، که پیچیده، حجیم و گران است، خواندن یادداشت های سخنران بدون اجتناب از پدیده آزاردهنده زاویه وحشتناک یک وب کم که به بالا نگاه می کند یا به بالا می رود، تقریبا غیرممکن است. پایین بینی شما
آیا راه های سریعی برای رفع مشکل نگاه چشم وجود دارد؟
راه های مختلفی برای کاهش این مشکل در راه اندازی دسکتاپ یا لپ تاپ معمولی خانگی وجود دارد. با این حال، این رویکردها به شدت فریبنده هستند و مشکل را برطرف نمی کنند.
چندین شرکت وبکمهای خارجی کوچکی را ارائه میکنند که اغلب بدون میکروفون داخلی مجهز شدهاند تا اندازه دستگاه را کاهش دهند و امکان قرار دادن در مرکز صفحه نمایش شما، در مقابل هر گونه متن یا پنجره مشاهده برنامه ویدیویی مورد استفاده شما را فراهم کنند. .
این دوربین ها از سیم نازکی استفاده می کنند که به بالای صفحه نمایش متصل شده است. به این ترتیب، شما مستقیماً به وبکم نگاه میکنید و میتوانید بیشتر، هرچند نه همه، مطالب ارائه شده یا متنی را که ارائه میکنید، ببینید.
با این حال، روش دیگر استفاده از یک قطعه پلاستیکی شفاف اکریلیک است که به شما امکان می دهد تقریباً هر وب کم را نصب کنید و آن را به بالای صفحه نمایش وصل کنید تا وب کم به تنهایی در مقابل نقطه مرکزی نمایشگر آویزان شود.
مزیت این روش این است که شما را آزاد می کند تا از وب کم دلخواه خود استفاده کنید. نکته منفی این است که اندازه وبکم و دستگاه پلاستیکی اکریلیک اغلب قسمتهای زیادی از صفحهنمایش را پنهان میکند و بهعنوان یک جایگزین تله پرومتر کمتر کاربرد دارد.
در پایین جاده، ممکن است نمایشگرهای لپ تاپ و رایانه شخصی با وب کم های یکپارچه در پشت پنل LCD را ببینیم که برای کاربر نامرئی هستند. در حالی که این یک راه حل ایده آل برای مشکلی است که در بالا توضیح دادم، اما نکته منفی این است که هزینه این نمایشگرهای ویژه بسیار بالا خواهد بود، که اکثر تولیدکنندگان به دلیل پیامدهای کشش قیمتی تمایلی به ارائه آن ندارند.
هوش مصنوعی می تواند مشکلات تماس چشمی را به راحتی و مقرون به صرفه اصلاح کند.
ایده استفاده از هوش مصنوعی برای کاهش یا از بین بردن تماس چشمی در طول کنفرانس ویدئویی جدید نیست. وقتی به درستی انجام شود، هوش مصنوعی میتواند نیاز به خرید تجهیزات گرانقیمت تلههدفگیری را که استودیوهای تلویزیونی استفاده میکنند، برطرف کند یا به برخی از روشهای هوشمندانهای که در بالا توضیح دادم متوسل شوند.
چالش استفاده از هوش مصنوعی برای انجام اصلاحات تماس چشمی در پرواز (زنده) یا حتی در یک اسکریپت ضبط شده این است که برای انجام بیشتر کارهای سنگین به اسب بخار پردازنده نیاز دارد.
اپل سیلیکون چندین سال است که این قابلیت یکپارچه را با تراشه های آیفون خود دارد. تعداد کمی از کاربران می دانند که برنامه FaceTime اپل دارای تصحیح تماس چشمی است (که می توان آن را خاموش کرد) که تضمین می کند که نگاه شما بدون توجه به جهت آیفون در وسط صفحه متمرکز شود.
تنظیم تماس چشمی در برنامه FaceTime اپل
مایکروسافت نیز برای رفع مشکلات تماس چشمی به حزب هوش مصنوعی پیوسته است. سال گذشته، اعلام کرد که قابلیت راه حل تماس چشمی را به ویندوز 11 اضافه می کند، از قدرت راه حل های Qualcomm Arm و بهره گیری از سیلیکون واحد پردازش عصبی (NPU) برای بهبود ویدئو و صدا در جلسات – از جمله کادربندی اشیا، پس زمینه کاهش نویز و محو شدن پس زمینه
بسیاری از این ویژگی ها در حال حاضر در دستگاه سرفیس پرو ایکس مایکروسافت که از تراشه Arm استفاده می کند، موجود است. با این حال، مایکروسافت امسال به طور گسترده این قابلیت را برای مدل های سازگارتر از OEM های اصلی رایانه های شخصی عرضه خواهد کرد.
پخش Nvidia با تماس چشمی
برنامه Broadcast Nvidia که با طیف وسیعی از کارتهای گرافیک خارجی Nvidia کار میکند، یک ابزار هوش مصنوعی قوی است که تماسهای ویدیویی و ارتباطات را در رایانههای مبتنی بر x86 افزایش میدهد. هفته گذشته، انویدیا این ابزار را در نسخه 1.4 بهبود بخشید تا از اجرای تماس چشمی خود پشتیبانی کند، که به نظر می رسد سوژه در ویدیو مستقیماً به دوربین نگاه می کند.
افکت جدید تماس چشمی، چشم های بلندگو را برای بازتولید تماس چشمی با دوربین تنظیم می کند. این قابلیت با استفاده از قدرت هوش مصنوعی در پردازندههای گرافیکی انویدیا برای تخمین و همترازی دقیق نگاه به دست میآید.
افکت جدید تماس چشمی در Nvidia Broadcast 1.4 چشمان بلندگو را برای شبیه سازی تماس چشمی با دوربین حرکت می دهد. | اعتبار تصویر: Nvidia
مزیت رویکرد انویدیا توانایی محدود نشدن به یک پلت فرم یا برنامه ویدئو کنفرانس است. اپل از توانایی خود برای اصلاح تماس چشمی فقط با استفاده از برنامه FaceTime در آیفون پشتیبانی می کند. با این حال، تعجب نمیکنم اگر اپل این قابلیت را در اواخر امسال به همراه قابلیت دوربین پیوسته خود برای کاربران macOS گسترش دهد.
علاوه بر این، Nvidia Broadcast عملکرد Vignette را ارائه می دهد که با آنچه بسیاری از کاربران برنامه اینستاگرام تجربه می کنند قابل مقایسه است. به این ترتیب، Nvidia Broadcast میتواند کمی تاری پسزمینه ایجاد کند تا یک نمای تار شبیهسازیشده با هوش مصنوعی از وبکم شما ایجاد کند و کیفیت نما را فوراً بهبود بخشد.
جایگزین کردن تصاویر پسزمینه در تماسهای ویدئو کنفرانس چیز جدیدی نیست. با این حال، رویکرد انویدیا به احتمال زیاد کیفیت بهتری را ارائه می دهد زیرا از قدرت کارت های گرافیک خود استفاده می کند، کارت هایی که برای ایجاد محتوای ویدیویی و بازی بهینه شده اند.
افکار نهایی
ویژگی تماس چشمی در برنامه Broadcast انویدیا در حال حاضر در فرم بتا است و هنوز برای استقرار آماده نیست. مانند هر ویژگی بتا، از مشکلات اجتناب ناپذیری رنج خواهد برد و باید قضاوت رسمی در مورد کیفیت آن را تا عرضه نسخه تولیدی به تعویق بیاندازیم.
علاوه بر این، Nvidia Broadcast فقط یک برنامه استاندارد نیست، بلکه یک SDK باز با ویژگی هایی است که می تواند در برنامه های شخص ثالث ادغام شود. این یک پتانسیل جدید جالب را برای برنامه های شخص ثالث برای استفاده مستقیم از عملکرد در Nvidia Broadcast باز می کند.
با این حال، من از برخی از واکنشهایی که در چند سال گذشته در مورد چشمانداز استفاده از هوش مصنوعی برای اصلاح تماس چشمی ظاهر شده، شگفتزده هستم. برخی از تحلیلگران فناوری از عباراتی مانند “عامل خزنده” برای دسته بندی این ویژگی به غیرجذاب ترین شکل ممکن استفاده کرده اند.
در واقع، اگر پسافکت غیرطبیعی و مصنوعی به نظر برسد، این توانایی الهامبخش بسیاری از شوخیهای شاید شایسته است. با این حال، این نام شوم دور از ذهن و ناصادقانه به نظر می رسد. میتوان در مورد استفاده از آرایش یا استفاده از ابزارهای بهبودیافتهای که نقصهای صوتی را در طول تماس ویدیویی برطرف میکنند، تلقین مشابهی داشت. برنامههایی مانند TikTok یا Instagram بدون فیلتر وجود ندارند، که به نظر من تصاویر بسیار وحشتناکتری ایجاد میکنند.
چه بخواهیم چه نخواهیم، ویدئو کنفرانس به عنوان یکی از نتایج مثبت دنیای پس از همه گیری باقی مانده است. استفاده از فناوری که مکالمات ویدیویی مؤثرتر، جذابتر و تأثیرگذارتر را تسهیل میکند، چیزی است که باید از آن استقبال کنیم، نه تحقیر.
به عنوان کسی که یک پادکست ویدیویی هفتگی تولید میکند و پتانسیل حذف یا حتی کاهش نگاه چشم را تشخیص میدهد، که به نوبه خود میتواند مزایایی شبیه به تله پرومپتر ارائه دهد، مشتاقانه منتظر آزمایش این قابلیت بسیار مورد نیاز در هفتههای آینده هستم.