Nvidia DLSS 3 چگونه کار می کند و چرا FSR هنوز نمی تواند به آن برسد
کارتهای گرافیک سری RTX 40 انویدیا تنها در چند هفته کوتاه وارد بازار میشوند، اما در میان تمام پیشرفتهای سختافزاری آن چیزی است که میتواند تخم طلایی انویدیا باشد: DLSS 3. این بسیار بیشتر از یک بهروزرسانی برای ویژگی محبوب DLSS (Deep Learning Super Sampling) است. Nvidia، و در نهایت می تواند نسل بعدی Nvidia را بسیار بیشتر از خود کارت گرافیک تعریف کند.
AMD سخت کار کرده است تا رزولوشن FidelityFX Super Resolution (FSR) خود را با DLSS هماهنگ کند و در چند ماه گذشته موفق بوده است. به نظر میرسد DLSS 3 این پویایی را تغییر میدهد – و این بار، FSR ممکن است نتواند به این زودیها به آن برسد.
DLSS 3 چگونه کار می کند (و چگونه کار نمی کند)
اگر فکر می کنید DLSS 3 یک نسخه کاملاً جدید از DLSS است، بخشیده می شوید، اما اینطور نیست. یا حداقل کاملاً جدید نیست. ستون فقرات DLSS 3 همان فناوری با وضوح فوق العاده است که امروزه در عناوین DLSS موجود است و Nvidia احتمالاً با نسخه های جدید به بهبود آن ادامه خواهد داد. انویدیا می گوید اکنون بخش فوق العاده رزولوشن DLSS 3 را به عنوان یک گزینه جداگانه در تنظیمات گرافیکی مشاهده خواهید کرد.
قسمت جدید تولید فریم است. DLSS 3 در هر فریم دیگر یک فریم کاملا منحصر به فرد ایجاد می کند، که اساساً از هر هشت پیکسلی که می بینید، هفت پیکسل تولید می کند. شما می توانید تصویری از این موضوع را در نمودار زیر مشاهده کنید. در مورد 4K، GPU شما تنها پیکسل ها را برای 1080p رندر می کند و از این اطلاعات نه تنها برای فریم فعلی، بلکه برای فریم بعدی نیز استفاده می کند.
طبق گفته انویدیا، تولید فریم سوئیچ جدا از وضوح فوق العاده خواهد بود. دلیلش این است که در حال حاضر تولید فریم فقط روی پردازندههای گرافیکی سری RTX 40 کار میکند، در حالی که وضوح فوقالعاده روی تمام کارتهای گرافیک RTX، حتی در بازیهایی که به DLSS 3 بهروزرسانی شدهاند، به کار خود ادامه خواهد داد. فریم ها به طور کامل تولید می شوند، این کارایی شما را افزایش می دهد زیاد.
با این حال، تولید فریم فقط نوعی سس مخفی هوش مصنوعی نیست. در DLSS 2 و ابزارهایی مانند FSR، بردارهای حرکتی ورودی کلیدی برای مقیاس بندی هستند. آنها مکان حرکت اجسام از یک فریم به فریم دیگر را توصیف می کنند، اما بردارهای حرکتی فقط به هندسه یک صحنه اشاره می کنند. عناصری که هندسه سه بعدی ندارند، مانند سایهها، انعکاسها و ذرات، به طور سنتی با فرآیند مقیاسبندی پوشانده میشوند تا از مصنوعات بصری جلوگیری شود.
هنگامی که هوش مصنوعی یک قاب کاملا منحصر به فرد ایجاد می کند، پوشش دادن گزینه ای نیست، جایی که شتاب دهنده جریان نوری در پردازنده های گرافیکی سری RTX 40 به کار می رود. این مانند یک بردار حرکتی است، با این تفاوت که کارت گرافیک حرکت تک تک پیکسل ها را از یک فریم به فریم دیگر ردیابی می کند. این میدان جریان نوری، همراه با بردارهای حرکت، عمق و رنگ، به فریم تولید شده توسط هوش مصنوعی کمک می کند.
همه مزایا به نظر می رسد، اما یک مشکل بزرگ با فریم های تولید شده با هوش مصنوعی وجود دارد: آنها تاخیر را افزایش می دهند. فریم تولید شده توسط هوش مصنوعی هرگز از رایانه شما عبور نمی کند – این یک فریم “جعلی” است، بنابراین شما آن را در قرائت فریم در ثانیه سنتی در بازی ها یا ابزارهایی مانند FRAPS نخواهید دید. بنابراین تأخیر کاهش نمی یابد، حتی با وجود تعداد زیادی فریم اضافی، و به دلیل هزینه محاسباتی جریان نوری، تأخیر در واقع بالا می رود. بنابراین DLSS 3 به Nvidia Reflex نیاز دارد تا تاخیر بالاتر را جبران کند.
معمولاً CPU شما یک صف رندر برای کارت گرافیک شما نگه می دارد تا مطمئن شود GPU شما هرگز منتظر کار نیست (این امر باعث لکنت و کاهش نرخ فریم می شود). Reflex صف رندر را حذف می کند و GPU و CPU را همگام می کند تا به محض اینکه CPU بتواند دستورالعمل ها را ارسال کند، GPU شروع به پردازش آنها می کند. هنگامی که در بالای DLSS 3 اعمال می شود، Nvidia می گوید که Reflex گاهی اوقات حتی می تواند منجر به کاهش تاخیر شود.
جایی که هوش مصنوعی تفاوت را ایجاد می کند
FSR 2.0 AMD از هوش مصنوعی استفاده نمی کند، و همانطور که مدتی پیش نوشتم، ثابت می کند که می توانید به جای یادگیری ماشینی، کیفیت DLSS را با الگوریتم ها دریافت کنید. DLSS 3 با قابلیت های منحصر به فرد تولید فریم و همچنین معرفی جریان نوری، این را تغییر می دهد.
جریان نوری ایده جدیدی نیست – دهه هاست که وجود دارد و در همه چیز از برنامه های ویرایش ویدیو گرفته تا ماشین های خودران کاربرد دارد. با این حال، محاسبه جریان نوری با یادگیری ماشین به دلیل افزایش مجموعه دادهها برای آموزش مدلهای هوش مصنوعی نسبتاً جدید است. دلیل اینکه می خواهید از هوش مصنوعی استفاده کنید ساده است: با آموزش کافی خطاهای بصری کمتری ایجاد می کند و زمان اجرا زیادی ندارد.
DLSS در زمان اجرا اجرا می شود. میتوان الگوریتمی را بدون یادگیری ماشین توسعه داد تا تخمین بزند که هر پیکسل چگونه از یک فریم به فریم دیگر حرکت میکند، اما از نظر محاسباتی گران است، که در وهله اول کل نقطهی ابرنمونهبرداری را شکست میدهد. با یک مدل هوش مصنوعی که به اسب بخار زیاد و داده های آموزشی کافی نیاز ندارد – و مطمئن باشید، انویدیا داده های آموزشی زیادی برای کار دارد – می توانید به جریان نوری با کیفیت بالا و قابل اجرا در زمان اجرا دست یابید.
این منجر به بهبود نرخ فریم حتی در بازیهای دارای محدودیت CPU میشود. Supersampling فقط برای وضوح شما اعمال می شود که تقریباً به طور کامل به GPU شما بستگی دارد. با یک فریم جدید که پردازش CPU را دور میزند، DLSS 3 میتواند نرخ فریم بازیها را حتی اگر گلوگاه کامل CPU داشته باشید، دو برابر کند. این قابل توجه است و در حال حاضر فقط با هوش مصنوعی امکان پذیر است.
چرا FSR 2.0 نمی تواند به آن برسد (در حال حاضر)
AMD واقعاً غیرممکن ها را با FSR 2.0 انجام داد. فوق العاده به نظر می رسد، و این واقعیت که مارک آگنوستیک است حتی بهتر است. من از اولین باری که آن را دیدم آماده بودم DLSS را برای FSR 2.0 کنار بگذارم Deathloop. اما به همان اندازه که از FSR 2.0 لذت می برم و فکر می کنم یک کیت عالی از AMD است، به این زودی ها به DLSS 3 نمی رسد.
برای شروع، توسعه الگوریتمی که بتواند هر پیکسل را بین فریم ها بدون آرتیفکت ردیابی کند، به اندازه کافی سخت است، به خصوص در یک محیط سه بعدی با جزئیات دقیق متراکم (Cyberpunk 2077 نمونه بارز است). ممکن است، اما دشوار است. با این حال، مشکل بزرگتر این است که این الگوریتم چقدر باید پف کرده باشد. ردیابی هر پیکسل از طریق فضای سه بعدی، انجام یک محاسبه جریان نوری، تولید یک فریم، و پاک کردن هر گونه اتفاق ناگواری که در طول مسیر اتفاق می افتد – سوال زیادی است.
شروع به کار کردن آن در حالی که بازی در حال اجرا است و همچنان نرخ فریم را بهبود می بخشد تا سطح FSR 2.0 یا DLSS حتی بیشتر از این است. انویدیا، حتی با پردازندههای اختصاصی و یک مدل آموزشدیده، همچنان باید از Reflex برای جبران تأخیر بیشتر ناشی از جریان نوری استفاده کند. بدون این سختافزار یا نرمافزار، FSR احتمالاً با تأخیر زیادی برای تولید فریم معامله میکند.
من شک ندارم که AMD و سایر توسعه دهندگان در نهایت به آنجا خواهند رسید – یا راه دیگری برای حل مشکل پیدا خواهند کرد – اما ممکن است چند سال دیگر به آن برسد. در حال حاضر گفتنش سخت است.
به راحتی می توان گفت که DLSS 3 بسیار هیجان انگیز به نظر می رسد. البته برای تایید ادعای عملکرد انویدیا و اینکه کیفیت تصویر چگونه حفظ می شود، باید منتظر بمانیم تا اینجا بیاید. در حال حاضر، ما فقط یک ویدیوی کوتاه از Digital Foundry داریم که DLSS 3 فریمی را نشان میدهد (در بالا)، که توصیه میکنم تا زمانی که آزمایشهای شخص ثالث بیشتری را ببینیم، آن را تماشا کنید. با این حال، از نقطه نظر فعلی ما، DLSS 3 قطعا امیدوارکننده به نظر می رسد.
این مقاله بخشی از ReSpec است، یک ستون دوهفتهای در حال انجام که شامل بحثها، نکات و گزارشهای عمیق درباره فناوری پشت بازی رایانههای شخصی است.
توصیه های سردبیران