چرا GPU جدید انویدیا از گرافیک یکپارچه ضعیف عمل می کند؟
ممکن است کسی فکر کند که یک GPU با قیمت بیش از 40000 دلار بهترین کارت گرافیک برای بازی خواهد بود، اما حقیقت بسیار پیچیده تر از این است. در واقع، این پردازنده گرافیکی انویدیا حتی نمی تواند از پس راه حل های گرافیکی یکپارچه برآید.
حالا، قبل از اینکه خیلی ناراحت شوید، باید بدانید که منظور من H100 انویدیا است که شامل تراشه GH100 (Grace Hopper) است. این یک GPU مرکز داده قدرتمند است که برای انجام وظایف محاسباتی با کارایی بالا (HPC) ساخته شده است – نه بازی های رایانه ای قدرتمند. خروجی نمایشگر وجود ندارد و با وجود قابلیت های گسترده، خنک کننده نیز وجود ندارد. این به این دلیل است که دوباره این GPU را در یک مرکز داده یا سرور پیدا خواهید کرد که در آن با فن های خارجی قدرتمند خنک می شود.
اگرچه “تنها” 14592 هسته CUDA دارد (که کمتر از RTX 4090 است)، اما همچنین دارای مقدار دیوانه کننده ای از VRAM و یک اتوبوس عظیم است. در مجموع، GPU دارای 80 گیگابایت حافظه HBM2e است که به پنج پشته HBM تقسیم شده است که هر کدام به یک گذرگاه 1024 بیتی متصل هستند. برخلاف پردازندههای گرافیکی مصرفی انویدیا، این کارت همچنان دارای NVLink است، به این معنی که میتوان آن را برای کار یکپارچه در سیستمهای چند GPU پیوند داد.
سوال باقی می ماند: دقیقاً چرا این نوع GPU در استفاده عمومی و بازی بسیار بد است؟
برای نشان دادن این مورد، YouTuber Gamerwan چهار عدد از این کارتهای گرافیک H100 را برای آزمایش دریافت کرد و تصمیم گرفت یکی را در یک سیستم ویندوز معمولی قرار دهد تا عملکرد آن را بررسی کند. این یک مدل PCIe 5.0 بود و به دلیل نداشتن خروجی نمایشگر باید با RTX 4090 جفت می شد. گیمروان همچنین یک خنک کننده خارجی طراحی شده سفارشی را چاپ سه بعدی کرد تا GPU را روان کار کند.
برای اینکه سیستم حتی H100 را به عنوان یک GPU مناسب تشخیص دهد، کمی کار میطلبد، اما زمانی که گیمروان از موانع عبور کرد، توانست پشتیبانی از ردیابی پرتو را نیز فعال کند. با این حال، همانطور که بعداً در طول آزمایش متوجه شدیم، پشتیبانی زیادی از هیچ چیز دیگری در یک پلت فرم غیر مرکز داده وجود ندارد.
در آزمایش استاندارد 3DMark Time Spy، GPU تنها به 2681 امتیاز رسید. در مقایسه، میانگین امتیاز RTX 4090 30353 امتیاز است. این امتیاز H100 را جایی بین GTX 1050 مصرف کننده و GTX 1060 قرار می دهد. مهمتر از آن، تقریباً مشابه Radeon 680M AMD است که یک GPU یکپارچه است.
تست های بازی نیز ضعیف عمل کردند، به طوری که کارت گرافیک به طور متوسط 8 فریم در ثانیه (fps) را ثبت کرد. Red Dead Redemption 2. فقدان پشتیبانی نرمافزاری باعث میشود که در اینجا سر زشتی وجود داشته باشد – اگرچه H100 میتواند حداکثر با 350 وات کار کند، به نظر میرسد که سیستم نمیتواند آن را از 100 وات عبور دهد و در نتیجه عملکرد به میزان قابل توجهی کاهش مییابد.
دلایل مختلفی برای این عملکرد ضعیف نیروهای بازی وجود دارد. برای یک چیز، اگرچه H100 یک کارت گرافیک فوق العاده قدرتمند روی کاغذ است، اما از نظر معماری با پردازنده گرافیکی AD102 که RTX 4090 را تامین می کند بسیار متفاوت است. این کارت تنها دارای 24 واحد عملیاتی شطرنجی (ROPs) است که به میزان قابل توجهی کمتر است. از 160 ROP که RTX 4090 دارد. علاوه بر این، تنها چهار مورد از 112 خوشه پردازش بافت (TPC) می توانند بارهای کاری گرافیکی را ارائه دهند.
پردازندههای گرافیکی مصرفکننده انویدیا از پشتیبانی نرمافزاری زیادی برای اجرای خوب برخوردار میشوند. این شامل درایورها، اما همچنین پشتیبانی سیستم از سوی توسعه دهندگان – هم در بازی ها و هم در بنچمارک ها می شود. هیچ درایوری برای بهینه سازی عملکرد این پردازنده گرافیکی برای بازی وجود ندارد و نتیجه، همانطور که می بینید، بسیار بد است.
ما قبلاً قدرت درایورها را با Intel Arc مشاهده کردهایم، جایی که سختافزار یکسان باقی مانده است، اما پشتیبانی از درایور بهبود یافته بهبودهایی در عملکرد ارائه میکند که در صورت خرید یک GPU مقرون به صرفه، Arc را به گزینهای مناسب تبدیل میکند. بدون درایورهای Nvidia Game Ready و بدون دسترسی به بقیه نرم افزارهای Nvidia (از جمله DLSS 3 همیشه چشمگیر)، H100 یک پردازنده گرافیکی 40000 دلاری است که هیچ گونه بازی ای را اجرا نمی کند.
این اساسا یک GPU محاسباتی است، نه یک کارت گرافیک به همان روشی که اکثر ما آنها را می شناسیم. این برای انواع وظایف HPC، با تمرکز قوی بر روی بار کاری هوش مصنوعی ساخته شده است. انویدیا از نظر هوش مصنوعی برتری زیادی نسبت به AMD دارد و کارت هایی مانند H100 نقش مهمی در این امر ایفا می کنند.
توصیه های سردبیران