آنچه دربارهی سختافزار کنسول نسل بعدی نینتندو میدانیم
خیلی وقت پیش، در ژوئن سال ۲۰۲۱، لیکری با نام مستعار kopite7kimi که بهخاطر درز دادن اطلاعات تکنولوژیهای جدید معروف است، تصویری پرجزییات از پردازندهی T234 انویدیا منتشر کرد. و برای اولین بار معلوم شد نینتندو هم قرار است نسخهی ویرایششدهای از همین پردازنده به نام T239 را برای کنسول بعدیاش استفاده کند. بعد از دو سال، شواهد خیلی بیشتری منتشر شد که نشان میداد این شایعات حقیقت داشتند. T239 یک پردازندهی قابلحمل(۱) است که بر سیپییوی هشت هستهای ARM A78C سوار شده، به اضافهی یک واحد گرافیکی مخصوص بر اساس معماری سری کارتهای RTX-30 انویدیا که به نام آمپر/Ampere شناخته میشوند. ریزمعماری/Microarchitecture آن نیز برخی از ویژگیهای آخرین جیپییوهای لاولیس/Lovelace را برگردانده و یک انجین فشردهزدای(۲) کاملا جدید به آن اضافه کرده است. اینکه این پردازنده از ایپیآی(۳) خاص کنسول استفاده میکند هم دوباره مهر تاییدی است بر اینکه در کنسول نسل بعدی نینتندو سوییچ استفاده خواهد شد.
در این مقاله، دربارهی شواهد مختلفی خواهیم نوشت که رابطهی بین پردازندهی T239 و نینتندو را نشان میدهند. همچنین یک جیپییوی قابلحمل که از نظر سختافزاری قدرت مشابهی با این پردازنده داشته باشد را شدیدا داونکلاک میکنیم تا ببینیم یک کارت گرافیکی مبتنی بر معماری آمپرِ کمقدرت چه تواناییهایی دارد، و مثلا آیا میتواند ری تریسینگ را اجرا کند و آپاسکیلینگ با DLSS برای کنسول هیبریدی نسل بعدی نینتندو چقدر اهمیت دارد. در پایان خواهیم دید آیا تحلیل ما با اطلاعات پراکندهای که از سوییچ ۲ داریم (که در گیمزکام برای عدهی معدودی از سازندگان رونمایی شد) سنخیت دارد یا نه.
اما اول از همه باید با یک سوال اساسی شروع کنیم. آیا میتوانیم با قطعیت و صددرصد بگوییم که از T239 در سوییچ ۲ استفاده خواهد شد؟ جواب منفی است. بااینحال قطعا میتوانیم T239 را به یک پروژه از نینتندو مرتبط بدانیم و هیچ شواهدی نیست – و حتی نیازی هم نیست – که انویدیا این چیپ را برای کمپانی دیگری ساخته باشد. بههرحال، انویدیا برای تعمین نیازش در بازار خودرو و رباتیک همین الان هم از T234 استفاده میکند. و برای فهم نسخهی ویرایششدهی آن، یعنی T239، خوب است که اول با خود T234 آشنا شویم و اینکه چرا نینتندو نمیتواند از آن استفاده کند.
بههرحال برای سوییچ ۱ کسی پردازندهی مخصوص نساخت. گرچه وقتی سوییچ ۱ معرفی شد انویدیا طور دیگری وانمود میکرد، اما چیپ کنسول هیبریدی نینتندو همان تگرا ایکسوان/Tegra X1 و بدون تغییر بود (گرچه برخی از قابلیتهایش غیرفعال شده بودند، مثل هستههای پایینی سیپییو). این چیپ که از همان اول برای بازار گیمینگ، موبایل و تبلت ساخته شده بود، بیارزش و در حاشیه بود، اما وقتی نینتندو از آن برای سوییچ استفاده کرد دوباره احیا شد. برای سوییچ ۲ هم انویدیا نمیتواند دوباره نسخهی دیگری از تگرا را استفاده کند. آخرین پردازندههای تگرا — مثل T234 — برای یک بازار بهکل متفاوت و پرتقاضاتری ساخته شدهاند. ماهیت آن هنوز قابلحمل است اما پیکربندیاش آنقدری بزرگ و سنگین هست که بدرد یک کنسول جریاناصلی و جمعوجور نخورد.
یک چیزی را همینجا شفافسازی کنیم: T234 یک چیپ هیولاست. سایز ۴۵۵mm2 آن باعث میشود پردازندهی ۳۵۰mm2ای ایکسباکس سریز ایکس مقابل آن کوتوله به نظر برسد. این چیپ از همان تکنولوژی هشت نانومتری سامسونگ استفاده میکند که برای سری کارتهای RTX-30 استفاده شده بود، بنابراین نسبت به هفت نانومتری و شش نانومتری کنسولهای نسل فعلی عقبگرد حساب میشود. از نظر سایز سیپییو هم مجهز به هستههای ۱۲ ARM A78AE و جیپییوی آن نیز مبتنی بر معماری آمپر سری ۳۰ با ۲۰۴۸ هستهی CUDA و مموری اینترفیس ۲۵۶بیتی است. برای بازار خودرو و رباتیک، T234 شدیدا به ماشین لرنینگ نیاز دارد، بنابراین یک چیپ مخصوص برای بهبود دیپ لرنینگ هم در آن قرار گرفته است که قابلیتهایش با هستههای تنسور(۴) جیپییو بیشتر میشود.
T239 انویدیا — پردازنده نسل بعدی گیمینگ برای نینتندو
چیزی که از همان اول مشخص است این است که T234 زیادی برای یک پلتفرم هیبریدی که قابلحمل هم هست بزرگ است. برای تقریب به ذهن در نظر بگیرید که سایز این پردازنده ۴۵۵mm2 است و بهمراتب بزرگتر از ۳۹۲mm2ای همچون RTX 3070. و با عقل سلیم، اطلاعاتی که درز پیدا کردند و با هک حسابهای لینکدین اعضای فعلی و سابق انویدیا، حالا به خوبی میتوانیم تواناییهای T239 را تخمین بزنیم. مهم است بدانیم انویدیا توزیع لینوکس خاص خودش را دارد که گرچه بخش زیادی از آن عمومی نیست، اما به اندازه کافی به T239 اشاره کرده که به تصویری کلی از این پردازنده برسیم.
اول از همه میدانیم هستههای سیپییو بهکل با T234 متفاوت هستند. با اینکه هستههای نوع A78 ARM معمولا بیشتر استفاده میشود، اما نوع AE بر اساس استانداردهای سختگیرانهی شورای اتوموتیوهای الکترونیکی/Automotive Electronics Council ساخته شده و نیمی از هستههایش برای مقابله با نیم دیگر استفاده میشوند (که اصلا برای یک پلتفرم مخصوص گیم چیز خوبی نیست). توزیع لینوکس انویدیا نشان میدهد T239 هشت هسته دارد که روی یک کلاستر قرار گرفتهاند و این احتمال بالا میرود که سوییچ ۲ از مدل A78C استفاده کند.
پهنای باند حافظه برای یک کنسول قابلحمل خیلی مهم است و در حال حاضر چیزی که نینتندو سوییچ را اینقدر از نظر سختافزاری در تنگنا قرار داده پایینبودن پهنای باند حافظه است. اینترفیس ۲۵۶بیتی در T239 برای چنین کنسول قابلحملی زیادهازحد است و لیکها نشان میدهند از اینترفیس ۱۲۸بیتی استفاده خواهد شد (و تقریبا قطعی است که با حافظهی رم LPDDR5 همراه خواهد بود). انتظار داریم از ماکسیموم پهنای باند ۱۰۲ گیگابایتی استفاده شود، ولی ممکن است نینتندو برای بهینهتر کردن سیستمش آن را داونکلاک کند. ساپورت از دیسپلیپورت/DisplayPort — که بهراحتی برای HDMI هم کانفیگ میشود — در T239 وجود دارد و همینطور در پردازندهی نینتندو سوییچ فعلی. فرقش اینجاست که اگر نینتندو از آن استفاده کند پهنای باند حافظهی کافی برای استفاده از HDMI 2.1 هم بهوجود میآید.
سایر اطلاعاتی هم که از توزیع لینکوس انویدیا درز پیدا کرده جالب هستند. مثلا استفاده از مدیا بلاک کدگذاریشده/رمزگشاییشده که گرچه از چیپهای RTX سری ۳۰ و مبتنی بر معماری آمپر استفاده میکند، اما چون مدیا بلاک از روی آخرین چیپهای سری لاولیس بکپورت شده، ساپورت بهینهتری از فرمتهای مختلف مثل AV1 خواهد داشت [AV1 یکی از فرمتهای کدگذاری ویدئویی است که ابتدا برای انتقال ویدئوها در اینترنت استفاده میشد]. کلاکگیتینگ(۵) یکی از دیگر ویژگیهای سری لاولیس است که یکجورهایی راهش را به T239 هم باز کرده. بحث دربارهی میزان مصرف این چیپ به دلایل مختلف مشکلساز است و سعی میکنم در ادامهی مقاله مختصرا به آنها اشاره کنم.
توزیع لینوکس انویدیا تایید میکند T239 به افزایشدهندهی جریان نوری(۶) هم مجهز است (یکی از اجزای اساسی فریمساز DLSS 3). مشکل این است که این جریان نوری از آخرین نسل معماری آمپر است و نه معماری لاولیس که انویدیا در وهلهی اول بهخاطر همان بود که قابلیت فریمسازی را اضافه کرد. اینکه آیا نقشی در سوییچ ۲ خواهد داشت یا نه معلوم نیست، ولی جالب است که وقتی انویدیا این پردازندهی شخصیسازیشدهی کمقدرتترِ تگرا را ساخت این قطعه را کنار نگذاشت.
یک نکتهی دیگر هم در این پردازنده مهم است: FDE. این یک قطعهی سختافزاری کاملا جدید است که در T234 وجود ندارد. FDE مخفف File Decompression Engine (انجین فشردهزدایی از فایلها) است. مشابه همین تکنولوژی در پلیاستیشن ۵ هم وجود دارد و به این معناست که میشود اَسِت/assetها را با سرعت زیادی از فشردگی دربیاورد. Nate The Hate (لیککنندهای که اطلاعاتی دربارهی سوییچ ۲ منتشر کرد) در گزارش خود اعلام کرد که افسانهی زلدا: نفس وحش/The Legend of Zelda: Breath of the Wild روی سختافزار سوییچ ۲ بدون تقریبا هیچ لودینگی اجرا میشد. خب، T239 میدانیم که سختافزار لازم برای لودینگهای فوقسریع را دارد، اما برای عملیشدنش باید حافظهی بهمراتب سریعتری هم داشته باشد (که فعلا چیز زیادی دربارهاش نمیدانیم).
بعد از هک و درز اطلاعاتی جدید از انویدیا به تصویر خیلی پرجزییاتی از این پردازنده رسیدیم — جیپییوی مبتنی بر معماری آمپر، مموری باس ۱۲۸ بیتی و مموری LPDDR5، به اضافهی قابلیتهای بکپورتشدهای از سری لاولیس که به مصرف باتری کنسول کمک میکنند. این اطلاعات درزشده تلویحا نشان میدهند T239 شامل ۱۵۳۶ هستهی پردازش موازی کودا/CUDA است، یعنی سی درصد کمتر از تعداد هستههای کودای پردازندهی T234.
بنابراین چیپی داریم که بهمراتب قدرتش از برادر بزرگترش یعنی T234 کمتر است، قابلیتهای اضافیاش را از خود حذف کرده و درعینحال یک قطعهی فشردهزدای جدید اضافه دارد. چند سوال پیش میآید. از سیپییو و جیپییوی آن چه سرعت کلاکی باید انتظار داشته باشیم؟ سرعت مموری چقدر است؟ این سوالات برای فهم عملکرد یک پردازندهی قابلحمل مهم هستند. این سوال هم وجود دارد که آیا T239 مثل T234 ابزاری برای بهبود محاسبات دیپ لرنینگ دارد یا نه. به نظرم برای سوییچ ۲ و آپاسکیلکردن رزولوشن با DLSS وجود چنین چیزی لازم است.
دربارهی سرعت کلاک: انویدیا برای محاسبهی میزان مصرف T234 ابزاری فراهم کرده که با استفاده از آن میتوانیم به عملکرد احتمالی T239 هم پی ببریم. مثلا متوجه میشویم جیپییو معمولا در سرعت ۵۴۰ مگاهرتز عملکرد بهینهای دارد و برای چنین پلتفرمی کفایت میکند. اما هرقدر سرعت کلاک را بالاتر ببرید بهینهبودنش شدیدا کم میشود و مصرف قدرت بیشتری میطلبد (و طبیعتا دمایش هم بالاتر میشود). اگر نینتندو سرعت کلاک را بالای یک گیگاهرتز ببرد جای غافلگیری دارد و حدس میزنم خیلی پایینتر از این حرفها باشد. البته برای کلاک سیپییو، یک گیگاهرتز نقطهی مناسبی است. بااینحال این محاسبات با توجه به چیپ تگرای T234 انجام شده که به مراتب بزرگتر است و از تکنولوژی هشت نانومتری سامسونگ استفاده میکند. چیپ کوچکتری مثل T239 میتواند بهینهتر باشد و در حال حاضر هیچ شواهدی نیست که نشان دهد که همچنان از تکنولوژی غیربهینهی هشت نانومتری سامسونگ قرار است استفاده کند (گرچه حدس میزنم بکند).
از T239 چه انتظار عملکردی باید داشته باشیم؟
اگر بخواهیم همهی آنچه تا اینجا نوشتیم را خلاصهسازی کنیم: از چیپی به نام T239 اطلاعات پرجزییاتی به دست آوردهایم که چند سالی است در دست توسعه قرار دارد و دو سال پیش اطلاعاتش درز پیدا کرد و تاکنون بارها در توزیع لینوکس انویدیا و اطلاعات هکشدهی انویدیا و اطلاعات لینکدین اعضای انویدیا به آن اشاره شده است. اما یک مسئلهی دیگری هم هست که چه بسا آن را دلیلی غیرقابلانکار دانست: وقتی نینتندو سوییچ ساخته شد، انویدیا برای اینکه از همهی پتانسیل سیپییو و جیپییوی سختافزار استفاده کند یک API گرافیکی سطحپایین به کار برد. اسم آن NVN بود. اطلاعات هکشدهی انویدیا نشان میدهد آنها یک API گرافیکی جدید به نام NVN2 ساختهاند و برخی از قطعات انویدیا قرار است از آن استفاده کنند. در برخی از این کدها واضح است که T239 هم به آن مجهز خواهد بود. در واقع انویدیا نسخهای اصلاحشده از پردازندهی تگرا ساخته که هم کوچکتر است، هم بهینهتر است، و هم سختافزاری دارد که لودینگها را بهمراتب کم میکند — و مهمتر اینکه از NVN نسل بعدی برای API گرافیکی سوییچ ۲ پشتیبانی میکند.
پس، چه انتظاری میتوان از عملکرد T239 در یک کنسول بازی قابلحمل داشت؟ بابی کوتیک مدیرعامل اکتیویژن، در دادگاه کمیسیون فدرال تجارت که برای مایکروسافت برگزار شده بود، اخیرا اشاره کرد در جلسهای با نینتندو در سال قبل، متوجه شده عملکرد کنسول نسل بعدی نینتندو برابر با سختافزارهای نسل هشتمی است. خب، ممکن است واقعا همین باشد، ولی نباید فراموش کرد با اینکه سوییچ اسببخارش روی کاغذ در حد وییو یا ایکسباکس ۳۶۰ بود ولی در عمل خیلی بهتر از اینها بازیها را اجرا میکرد. اول از همه دلیلش این بود که جیپییوی مدرنتر و با حافظهی بیشتری داشت. شرط میبندم سوییچ ۲ هم همین منوال را ادامه دهد و فراتر هم برود. درست است که بابی کوتیک میگوید عملکرد سوییچ ۲ در حد پلیاستیشن ۴ است ولی در این در حالی است که میشنویم دموی Matrix Awakens با آنریل انجین ۵ هم روی سوییچ ۲ اجرا میشود (چیزی که پلیاستیشن ۴ نمیتواند اجرا کند). وقتی یک جیپییوی خیلی مدرنتر سیلیکونی شخصیسازیشدهی مجهز به هستههای تنسور ماشین لرنینگ و ری تریسینگ سختافزاری داشته باشید، دیگر مهم نیست اگر روی کاغذ سختافزارتان در حد پلیاستیشن ۴ باشد.
برای اینکه بدانید یک پردازندهی مبتنی بر معماری آمپر قابلحمل چه تواناییهایی دارد، شخصا دست به کار شدم و آزمایش کردم: سختافزاری مشابه با قابلیتهای کلاستر سیپییوی A78C روی پیسی وجود ندارد ولی در جیپییو تواناییهایش تقریبا یکی است. بنابراین یک لپتاپ مدل Dell Vostro 5630 با این مشخصات گرفتم: سیپییوی Core i7 1360p، شانزده گیگ رم ۴۸۰۰MHz نوع LPDDR5، یک هارد SSD 512 گیگی، و یک RTX 2050. خصوصا این قطعهی آخری برای آزمایشی که میخواهیم بکنیم مهم است.
اول از همه، با اینکه جزو RTX سری ۲۰ ردهبندی شده، ولی در واقع همان سیلیکونی را دارد که دیگر RTXهای ۳۰۵۰ و ۳۰۵۰ Ti دارند. T239 دارای ۱۵۳۶ هستهی کودا است ولی روی یک لپتاپ گیمینگ با جیپییوی مبتنی بر معماری آمپر سختافزاری که کمتر از ۲۰۴۸ هستهی کودا داشته باشد پیدا نکردیم. این سوال پیش میآید که پس چرا یک لپتاپ مجهز به RTX 3050 نگرفتیم؟ خب، ۲۰۵۰ را به چشم نسخهای از ۳۰۵۰ ببینید که مغزش را برداشته باشند — دارای قدرت کمتر، کلاک پایینتر و صرفا با حافظه اینترفیس ۶۴ بیتی. با پهنای باند ۹۶ گیگی در مقایسه با RTX 3050 خیلی ضعیفتر است اما تقریبا با پهنای باند احتمالی سوییچ ۲ برابری میکند. ولی هنوز یک گیری وجود دارد: ۲۰۵۰ تنها چهار گیگ رم دارد ولی انتظار دارم سوییچ ۲ تا هشت و بسا دوازده گیگ حافظه داشته باشد.
نتایج این آزمایش را در این ویدئو میتوانید ببینید، اما قبلش باید یک چیز را شفافسازی کرد: از نظر قدرت، این شبیهترین سختافزاری است که به T239 سوییچ ۲ پیدا کردیم، ولی باید به یاد داشت آنچه در ویدئو میبینید یک جیپییوی آمپر روی تنظیمات، سرعت کلاک و پهنای باند حافظهی شدیدا پایین است. قرار است صرفا ببینیم یک چیپ آمپر قابلحمل، که حتی عمدا تا سرعت ۷۵۰ مگاهرتز داونکلاکش کردم، تقریبا چه عملکردی دارد، و از روی آن به عملکرد احتمالی نینتندو سوییچ ۲ پی ببریم. با همهی این اوصاف، نتایج جالبی به دست آمد.
دموی Matrix Awakens را بهخاطر اینکه RTX 2050 صرفا چهار گیگ حافظه دارد نتوانستم اجرا کنم چون به نظر میرسد این دمو حداقل به حافظهی ۵.۶ گیگی نیاز داشته باشد. بااینحال فورتنایت اجراشده روی آنریل انجین ۵ را خوب با Lumen و Nanite و Virtual Shadow Maps اجرا میکند. برعکس نسخههای کنسولی، به ری تریسینگ سختافزاری روی نسخهی پیسی دسترسی داریم، و بله، همهی اینها روی لپتاپی با جیپییوی RTX 2050 اجرا میشوند. Lumen ریتریسینگ، هم مدل سختافزاریاش و هم نرمافزاریاش را، آزمایش کردم، و برای اجرای با رزولوشن نیتیو ۷۲۰p و چند مدل DLSS هم دیگر آزمایش شد که همه توانستند رزولوشن را تا ۱۰۸۰پی بالا ببرند. ریتریسینگ نرمافزاری با DLSS (رزولوشن ورودی ۵۴۰p و رزولوشن خروجی ۱۰۸۰p) از همه عملکردش بهتر بود، ولی اینطور هم نیست که سایر گزینهها عملکردشان بد باشد. نهایتا ۹.۵ درصد اختلاف دارند و فرقشان در حد ۲.۸۲ فریم است.
حدسم این است که اجرای دموی Matrix Awakens روی نینتندو سوییچ ۲ واقعیت دارد، ولی اپیک گیمز برای اینکه قابلیتهای کلیدی آنریل انجین ۵ را روی سوییچ اجراپذیر کند باید خیلی تغییرات زیادی ایجاد کند چون این دمو طبیعتا بهمراتب برای جیپییو سنگینتر است تا فورتنایت. اینکه این دمو را روی یک جیپییوی کمقدرت آمپر اجرا کردیم دربارهی عملکرد نهایی نینتندو سوییچ ۲ چیز زیادی نشان نمیدهد. اما باز هم اجرا میشود. میتوانید از ری تریسینگ سختافزاری هم استفاده کنید. DLSS هم کمک میکند.
برای محکزدن این سختافزار، دث استرندینگ را هم آزمایش کردم تا ببینم عملکردش در افتتاحیهی بازی که خیلی به جیپییو فشار میآورد چگونه است. با رزولوشن ۱۰۸۰پی نیتیو، میانگین فریم ریت ۳۴.۹ را گرفتم، که نشان میدهد قدرت احتمالی سوییچ ۲ احتمالا در همان حد و اندازهی کنسولهای نسل هشتمی است. روی رزولوشن ۷۲۰پی، فریم ریت تا روی ۵۲.۵ رفت. حالت کوالیتی DLSS را هم امتحان کردم — فریم ریت سابقا ۳۴.۹ای میانگین تا روی ۴۴.۷ بالا رفت. روی رزولوشن ۷۲۰پی هم فریم ریت بالاتر میرود اما ارزیابی عملکردش سخت است چون آن سکانس فریم ریتش روی ۶۰ قفل شده و بنابراین نمیدانم فریت ریت سابقا ۵۲.۵ که به ۶۰ میرسد دقیقا چه مقدار دیگر میتوانست بالاتر برود. با اینکه گیمپلی در حالت پرفورمنس DLSS و گرفتن رزولوشن ۱۴۴۰پی روی این جیپییوی مبتنی بر معماری آمپر عملکرد خوبی داشت و بیشتر اوقات سی فریم بود، اما بعضی جاها میلنگید. مثلا زمان رویارویی با BTهای بازی جیپییو کم میآورد.
آیا ساپورت از DLSS برای سوییچ ۲ حیاتی است یا صرفا یک قابلیت بدردبخور است؟
به باورم DLSS برای کنسول نسل بعدی نینتندو حیاتی است، اما اینکه به افسانهی «سوییچ با قابلیت فورکی» برسیم بسته به این دارد که آیا یکی از هستههای اساسی چیپ T234 در T239 هم وجود دارد یا نه. منظورم چیپ ارتقادهندهی دیپ لرنینگ است، یک قطعهی سختافزاری جداگانه که در ترکیب با هستههای تنسور درون جیپییو ممزوج میشود. آزمایشهایی که شخصا روی RTX 2050 انجام دادم نشان میدهد DLSS برای آپاسکیلکردن رزولوشن تا روی ۱۰۸۰پی و حتی ۱۴۴۰پی مفید است (همانطور که در مثال دث استرندینگ دیدیم). بااینحال هرقدر خروجی رزولوشن بالاتر باشد هزینهای هم که DLSS روی دست سختافزار میگذارد بالاتر میرود.
در دث استرندینگ مثلا هزینهی آپاسکیل رزولوشن ۷۲۰پی تا فورکی (حالت آلترا پرفورمنس DLSS) بالای ۱۸ میلی ثانیه است. برای همین یک سکانس شصت فریمی برای رندر کامل فریمها به ۱۶.۷ میلی ثانیه نیاز دارد. بااینحال اگر قطعهی سختافزاری بهبود دیپ لرنینگ که در چیپ T234 هست به T239 هم راه پیدا کند، DLSS روی نینتندو سوییچ ۲ میتواند پرقدرتتر ظاهر شود و این پروسه را با هزینهی کمتری انجام دهد.
مهم است روی اهمیت DLSS برای کل نینتندو سوییچ ۲ مجددا تاکید کنیم. همانطور که در آن ویدئو میبینید، تمام آزمایشهایی که روی گیمپلیهای بازیهای مختلف انجام دادیم تقریبا نتایج شگفتانگیزی داشتند — اما همه مدیون DLSS هستند که رزولوشن آنها را تا ۱۰۸۰پی آپاسکیل کرد. گرچه روی پیسی معمولا همه متفقالقولیم که آپاسکیل تا روی فورکی (حالت پرفورمنس)، یا روی ۱۴۴۰پی (حالت بالانس)، یا روی ۱۰۸۰پی (حالت کوالیتی) «مقبول» است، اما در دنیای کنسولها وضعیت فرق دارد: قرار است خیلی دور از صفحهی تلویزیون یا مانیتور بنشینید و انتظاراتتان هم از کیفیت با پیسی گیمرها فرق دارد. بههرحال حتی در همین نسل فعلی و در عملکرد کنسولهایی مثل پلیاستیشن ۵ و سریز ایکس هم رزولوشنهای واقعا پایینی دیدیم.
پس فکر میکنم یک چیپست قابلحمل در کنسولی که قرار است به تلویزیون وصل شود، اگر رزولوشن مثلا ۵۴۰پی خود را تا ۱۰۸۰پی آپاسکیل کند، قابل قبول است. اگر هم از ۷۲۰پی به ۱۰۸۰ آپاسکیل شده باشد (حالت کوالیتی DLSS) خیلی هم عالیست. قطعا خیلی بهتر از دیگر بازیهای گرافیکبالای سوییچ در زمانی است که روی حالت داک [صفحهی خود دستگاه و نه تلویزیون] اجرا میشوند. حالا آپاسکیل ۷۲۰پی تا فورکی چطور؟ دوباره، برای جواب به سوال به آن ویدئو رجوع کنید — فورکی تروتازهای نمیشود اما یک کنسول کمقدرت هم واقعا نیازی ندارد فورکی نیتیو را اجرا کند. همین که یک کیفیت معقول روی یک تلویزیون فورکی نشان دهد کافی است.
و اساسا انتظارم از توان سختافزاری و عملکرد احتمالی سوییچ ۲ با یک جیپییوی شدیدا داونگریدشدهی مبتنی بر معماری آمپر همین است. هنوز هم بحث و سوالات بیجواب باقی ماندهاند. عدهای باور دارند T239 قرار است صرفا برای یک نسخهی ارتقایافته از همان سوییچ ۱ استفاده شود، مثلا «سوییچ فورکی» یا «سوییچ پرو»، و نسل بعدی کنسول نینتندو قرار است چیز بهکل متفاوتی باشد. شخصا این نظریه را قبول ندارم: T239 و سایز جیپییویش و سختافزار شخصیسازیشدهاش بیشتر شبیه یک جهش بزرگ نسبت به تگرا ایکسوان است. مسئله بیشتر سر این است که آیا این چیپ برای چنین کنسول دستیای کفایت میکند یا نه؟
بااینحال سوالات و نگرانیهای معقولی دربارهی T239 وجود دارند. تا الان گفتیم T234 با سایز ۴۵۵mm2 زیادی برای کنسولی هیبریدی مثل نینتندو سوییچ ۲ بزرگ است — اما با وجود اینکه سیپییو و توان گرافیکیاش را پایین آوردهاند، احتمال زیاد T239 همچنان از تگرا ایکسوان با سایز ۱۱۸mm2ای سوییچ ۱ بهمراتب بزرگتر باشد. چیپ بزرگتر یعنی استفادهی بیشتر از سیستمهای خنککننده که احتمالا برای یک کنسول هیبریدی دستی/خانگی مناسب نیست. برخیها هم باور دارند T239 از تکنولوژی هشت نانومتری سامسونگ قرار نیست استفاده کند. ولی خب تا زمانی که سوییچ ۲ روی قفسهی مغازهها ظاهر نشود نمیتوانیم دربارهی صحت و سقم این نظریه مطمئن باشیم.
از دید من T239 بهترین کاندید برای پردازندهی کنسول نسل بعدی نینتندو سوییچ است. جنسن هوآنگ/Jensen Huang، موسس و مدیرعامل انویدیا، اعلام کرده همکاری بین انویدیا و نینتندو احتمالا تا دو دهه طول خواهد کشید. و با عرضهی احتمالی سوییچ ۲ در سال ۲۰۲۴، تاکنون هیچ اطلاعات قانعکنندهای دربارهی هیچ چیپ دیگری درز پیدا نکرده که نشان دهد ممکن است کنسول نسل بعدی نینتندو از چیپی بهجز T239 استفاده کند.
شخصا از آزمایش این نظریات با RTX 2050 لذت بردم. و این آزمایشها میتوانند یک تصویر کلی از تواناییهای کنسول نسل بعدی سوییچ ۲ نشان دهند. تقریبا هر بازی جدیدی روی آن خوب اجرا میشود به شرطی که تنظیمات را درست انتخاب کنید. و DLSS هم — دوباره — شدیدا حیاتی است و اگر از قطعهی سختافزاری بهبود ماشین لرنینگ در این چیپ استفاده کنند خیلی بهتر هم خواهد شد.
اما بگذارید یک بار دیگر تاکید کنم این آزمایشها صرفا تخمین تواناییهای T239 است. لپتاپی که روی آن آزمایش کردیم گرچه کلاک پایینتری دارد اما هستههای کودای آن بیشتر است. با اینکه پهنای باند حافظهاش برای یک پیسی کم است اما احتمالا نزدیکترین چیزی است که به T239 میتوانستیم پیدا کنیم (و البته نینتندو ممکن است همین را هم داونکلاک کند). و البته، در آزمایش ما روی لپتاپ، مغایرتی از سمت پهنای حافظه با سیپییو وجود نداشت (یکی از دیگر چیزهایی که عملکرد سختافزاری را کاهش میدهد).
بااینحال هنوز هم بارقهای از امید هست — و یادتان باشد که من نسخهی پیسی این بازیها را تست کردم که روی کنسولها گرافیکشان قابل شخصیسازی و تغییر نیست. و جادوی نهایی را باید خود بازیسازها رقم بزنند و دست خودشان است که چطور بتوانند روی سختافزاری محدود بازیشان را اجرا کنند. مثلا نگاه کنید به زمانی که دووم، ویچر ۳ یا ریمسترهای کرایسیس چگونه روی نینتندو سوییچ عرضه شدند، یا کار استادانهی استودیوی Rebellion North برای پورت سری اسنایپر الیت و نسخههای Zombie Army آن. این بازیها محدودیت سختافزاری تگرا ایکسوان را دور زدند. و جدا از اینکه T239 چه تواناییهایی دارد یا ندارد، توقع دارم باز هم اتفاقات مشابهی برایش بیافتد.
سوییچ ۲: سوالات مهمی که جوابی برایشان نداریم
برخی از سوالات اساسی ما دربارهی کنسول نسل بعدی نینتندو احتمالا وقتی سختافزار نهاییاش را ببینیم رفع میشوند. مثلا اینکه چقدر بزرگ است؟ باتری آن چه عملکردی دارد؟ ظاهر بازیها روی آن به چه شکل خواهد بود؟ سختافزار سوییچ فعلی — به اضافهی جویکانهایش — تا کجا با سوییچ ۲ قابلیت انطباق دارند؟ احتمالا در آینده از خود انویدیا که در توسعهی سختافزار سوییچ ۲ نقش دارد اطلاعات بیشتری کسب کنیم.
طبق همهی چیزهایی که در ماههای اخیر دربارهی T239 آموختهام، فکر میکنم چیزی که بیش از همه غافلگیرم کرد جاهطلبی سختافزارش بود. با داشتن فرصت اینکه یک پردازندهی جدید را از نو مخصوص گیم پیریزی کنند، انویدیا میتوانست همان مسیری را دنبال کند که سابقا برای گرافیکهای سری ۱۶ جیتیایکس دنبال کرده بود: ساخت گرافیکهای میانرده با حذف ماشین لرنینگ و ری تریسینگ، یا حداقل کاهش قدرت آنها برای فروش با قیمت کمتر (مثل کاری که AMD با ادغام ری تریسینگ در RDNA 2 کرد تا هزینه روی سیلیکون به کمترین حالت ممکن برسد). ولی در عوض، شواهد نشان میدهند انویدیا و نینتندو میخواهند تمام این قابلیتهای نسل نهمی را روی این چیپ جدید همچنان حفظ کنند و درعینحال وجود FDE هم نشان میدهد روی سیلیکونها (که برای تجارب گیمینگ میتوانند مهم باشند) خوب هزینه کردهاند. آیا ممکن است این جاهطلبانهترین سختافزار نینتندو از زمان گیمکیوب تا امروز باشد؟
در خصوص استفاده از سیلیکون هشت نانومتری سامسونگ هنوز سوالاتی وجود دارد. علیرغم اینکه نینتندو نسخهی ویرایششده و ضعیفتری از چیپ T234 را میخواهد استفاده کند ولی در همین هم یک نکتهی مثبت هست. اینگونه ممکن است بتواند از تکنولوژیهای شش، پنج یا چهار نانومتری برای بهبود عمر باتری و کاهش دمای کنسول استفاده کند، درست مثل کاری که در نسخههای اصلاحشدهی سوییچ مثل OLED و Lite انجام داد. در کوتاه مدت سوال این است که T239 چقدر بزرگ است و آیا ممکن است این باعث افزایش سایز کنسول شود (که به نظرم نینتندو چنین قصدی ندارد).
در حال حاضر و با نظر به اطلاعات درز پیدا کرده و غیررسمی دربارهی داخل کنسول نسل بعدی نینتندو اطلاعات بیشتری داریم تا دربارهی دیگر جزییات مهمش — مثلا اینکه آیا یک سختافزار بهکل جدید خواهد بود یا نه. T239 یک پردازنده مخصوص دستگاههای قابلحمل است، و با اینکه نینتندو تمام سرمایهاش را صرف توسعهی یک پلتفرم کرده و این نشان میدهد قرار است سوییچ جدیدی ببینیم، اما نینتندو همیشه نشان داده دنبال تکرار خود نیست و اینکه پلتفرم بعدیاش را صرفا «سوییچ ۲» بداند خلاف عادتش است. از آنجا که تا پردهبرداری از اطلاعات رسمی فاصلهی چندانی نداریم امید میرود که از این کنسول جدید اطلاعات بیشتری کسب کنیم.
منبع: Digital Foundry
توضیحات مترجم
۱. Mobile Processor: پردازندهای که در دستگاههایی مثل گوشی موبایل و لپتاپ و تبلت و دیگر کامپیوترهای قابل حمل استفاده میشوند.
۲. nvCOMP: لایبرریای که با آن میشود دیتاهای مختلف را با کمک جیپییو فشردهسازی یا فشردهزدایی کرد. این فشردهسازی از نوع بدون اتلاف/Lossless Compression است، یعنی میتوان دیتای اصلی را از دیتای فشردهشده بهطور کامل استخراج کرد بدون اینکه در این فرآیند اطلاعاتی از بین برود.
۳. API، مخفف Application Programming Interface، مثل پیغامرسانی است که بین سیستمهای نرمافزاری مختلف ارتباط برقرار میکند. این پیغامرسان قوانین و پروتکلهایی پیاده میکند تا یک نرمافزار بتواند از قابلیتها یا خدمات یک نرمافزار دیگر هم استفاده ببرد. API را به چشم یک گارسون در رستوان ببینید. وقتی به رستوان میروید تا غذا سفارش دهید مستقیما به آشپزخانه و سراغ آشپز نمیروید، بلکه ابتدا شما (نرمافزار) با یک پیغامرسان (گارسون یا همان API) صحبت میکنید تا دستوراتتان را به آشپز (نرمافزار دیگر) برساند.
نمونهی مثال بالا در دنیای دیجیتالی میشود چیزی مثل اپلیکیشن پیشبینی آب و هوا. خود اپلیکیشن قابلیت پیشبینی ندارد بلکه با API به یک نرمافزار یا سرویس دیگر درخواست میدهد تا دیتای لازم برای پیشبینی آب و هوا را برایش ارسال کند. اینگونه اپلیکیشن میتواند آخرین پیشبینیهای آب و هوایی را نشان دهد بدون اینکه برنامهنویس شخصا الگوریتمی برای پیشبینی آب و هوا کدنویسی کرده باشد. بهطور خلاصه، ایپیآی مثل واسط بین نرمافزارهای مختلف است تا با هم تعامل کنند و دیتایشان را به اشتراک بگذارند، مثل گارسونی که رابطهی بین شما و آشپزخانهی رستوان را ممکن میکند.
۴. Tensor Cores: سختافزارهایی که در بعضی از جیپییوها وجود دارند و بیشتر در حل معادلات ماتریس به سیستم کمک میکنند. انویدیا با معماریهای ولتا/Volta و تورینگ/Turing اولین بار این هستهها را به جیپییوهای خود اضافه کرد. هدف از طراحی آنها این بوده که کار هوش مصنوعی و دیپ لرنینگ سریعتر شود چون در این حوزهها معادلات ماتریس بسیار پرکاربرد هستند. هستههای تنسور ازایننظر مثل ریاضیدانان ابرهوشمندی میمانند که این معادلات ماتریس را سریع حل میکنند. آنها را میتوان به چشم یک آشپز متخصص در رستوران دید. با اینکه دیگر هستههای عادی جیپییوها در پختوپز انواع و اقسام غذاهای معمولی مهارت دارند، اما هستههای تنسور مثل آشپزهاییاند که فقط غذاهای خیلی حساس و ویژه مثل سوشی و خاویار میپزند.
۵. Clock gating: تکنیکی در مدارهای دیجیتالی که با غیرفعالکردن گزینشی سیگنالهای کلاکی که در آن لحظه بلااستفاده ماندهاند، به مصرف انرژی کمک میکند. مثل خاموش کردن لامپ اتاقهای خالی برای ذخیرهی برق است. کلاک گیتینگ هم در پردازندهها زمانی که ببیند بعضی از بخشها فعلا استفاده نمیشوند آنها را خاموش میکند. مثلا وقتی پردازندهای کار زیادی نمیکند یا در حالت low-power است، کلاک گینینگ هم مثلا واحد منطق محاسباتی (ALU) یا دیگر بخشها را غیرفعال میکند. این تکنیک چون مصرف انرژی را در ریزپردازندههای مدرن تا ۵۰ درصد کاهش میدهد، خصوصا برای پلتفرمهای قابل حملی چون سوییچ ۲ و افزایش عمر باتریشان بسیار مفید است.
۶. Optical flow accelerator: قطعهای سختافزاری یا الگوریتمی نرمافزاری که با آن حرکات اجسام در توالی صحنهها تخمین زده میشود. جهت سرعت پیکسلهای بین فریمهای متوالی محاسبه شده تا مشخص شود چقدر آبجکت در طول زمان در حال حرکت بودند. برای مثال ویدئوی ماشینی که روی جاده حرکت میکند را تصور کنید. این ابزارْ ویدئو را تحلیل و مسیر و سرعت ماشین را از طریق فریمها تعیین میکند. این اطلاعات برای اپلیکیشنهای مختلفی مثل ردگیری آبجکتها و مسیریابیها مفید است.