郵箱：611661226@qq.com

2020顯卡

發(fā)布時間: 2023-07-18 16:29 閱讀：文章來源：轉(zhuǎn)載

本內(nèi)容來源于@什么值得買APP，觀點(diǎn)僅代表作者本人｜作者：gaojie20

前言

▲1984年上映，由詹姆斯·卡梅隆導(dǎo)演，阿諾·施瓦辛格主演的《終結(jié)者》豆瓣評分高達(dá)8.2分，其中故事背景中的天網(wǎng)是人類于20世紀(jì)后期創(chuàng)造的以計(jì)算機(jī)為基礎(chǔ)的人工智能防御系統(tǒng)。之后自我意識覺醒，視全人類為威脅。電影劇情中，公元2029年，經(jīng)過核毀滅的地球已由電腦“天網(wǎng)”統(tǒng)治，人類幾乎被消滅殆盡。一個叫約翰·康納的軍事領(lǐng)袖召集幸存者一起對抗天網(wǎng)，組建了反抗軍組織。

▲其續(xù)集于2003年上映的《終結(jié)者3》片中顯示，天網(wǎng)的算力是60TFLOP/s，也就是每秒60萬億次浮點(diǎn)運(yùn)算。

▲其續(xù)集于2003年上映的《終結(jié)者3》片中顯示，天網(wǎng)的算力是60TFLOP/s，也就是每秒60萬次F浮點(diǎn)運(yùn)算

▲而在2022年的今天，英偉達(dá)最新發(fā)布的Ada Lovelace架構(gòu)新旗艦RTX 4090在3.15 GHz頻率下算力可以達(dá)到100TFLOP，所有也有網(wǎng)友調(diào)侃：看起來無所不能的天網(wǎng)，算力只相當(dāng)于0.6張RTX 4090顯卡。值得尋味的是《終結(jié)者》電影上映時間是1984年，而世界上第一塊顯卡發(fā)明于1981年，還是8位ISA顯卡。時間催化科技落地再擊穿曾經(jīng)電影中的科幻數(shù)據(jù)，究竟是劇本預(yù)設(shè)太保守，還是科技進(jìn)步太迅速呢？

NVIDIA Turing GPU 架構(gòu)于 2018 年推出，由TSMC 12nm工藝制造，開創(chuàng)了 3D 圖形和 GPU 加速計(jì)算的未來。圖靈在 PC 游戲、專業(yè)圖形應(yīng)用程序和深度學(xué)習(xí)推理的效率和性能方面取得了重大進(jìn)步。使用新的基于硬件的加速器，Turing 融合了光柵化、實(shí)時光線追蹤、人工智能和模擬，以在 PC 游戲中實(shí)現(xiàn)令人難以置信的真實(shí)感和電影品質(zhì)的互動體驗(yàn)。

▲兩年后的 2020 年，由Samsung 8nm 8N工藝制造的NVIDIA Ampere 架構(gòu)整合了更強(qiáng)大的 RT 核心和Tensor核心，以及一種新穎的 SM 結(jié)構(gòu)，與 Turing GPU 相比，該結(jié)構(gòu)可提供 2 倍 FP32 時鐘對時鐘的性能。這些創(chuàng)新使得 Ampere 架構(gòu)在傳統(tǒng)光柵圖形中的運(yùn)行速度比 Turing 快 1.7 倍，在光線追蹤中的運(yùn)行速度高達(dá) 2 倍。

▲2022年新的 NVIDIA Ada Lovelace GPU 架構(gòu)以數(shù)學(xué)家 Ada Lovelace 命名，他被認(rèn)為是世界上第一位計(jì)算機(jī)程序員，因?yàn)槭褂昧?TSMC 5nm 4N工藝制造，其構(gòu)架規(guī)模遠(yuǎn)遠(yuǎn)超過了 Turing 和 Ampere GPU。幾何復(fù)雜性的增加和照明的創(chuàng)新使圖形看起來比以往任何時候都更加逼真。與之前的 NVIDIA Ampere GPU 架構(gòu)相比，Ada 在光柵化游戲中的速度高達(dá) 2 倍，在光線追蹤游戲中的速度高達(dá) 4 倍。

Ada 圖形架構(gòu)預(yù)示著第三代 NVIDIA RTX 技術(shù)，通過利用實(shí)時光線追蹤來提高游戲視覺效果的真實(shí)性，而無需繪制純光線追蹤 3D 圖形所需的大量計(jì)算能力。這是通過將傳統(tǒng)的光柵圖形與光線追蹤元素（例如反射、照明和全局照明等）混合來完成的。第 3 代 RTX 預(yù)示著新的更高 IPC “Ada” CUDA 核心、第 3 代 RT 核心、第 4 代 Tensor 核心和新的光流處理器（Optical Flow Processor），該組件在不涉及 GPU 主圖形的情況下在生成新幀中起關(guān)鍵作用渲染管道。

NVIDIA Ada GPU 完整架構(gòu)

▲完整的 AD102 GPU 包括 12 個圖形處理集群 (GPC)、72 個紋理處理集群 (TPC)、144 個流處理器 (SM) 和一個 384 位顯存接口以及12 個 32 位顯存控制器。此外還包括 288 個 FP64 內(nèi)核（每個 SM 2 個），上圖中未顯示。 FP64 TFLOP 率是 FP32 操作的 TFLOP 率的 1/64。包含少量的 FP64 內(nèi)核以確保任何具有 FP64 代碼的程序都能正確運(yùn)行，其中還包括FP64 Tensor Core 代碼。

完整的 AD102 GPU 使用了12個GPC單元構(gòu)成，每個GPC的SM為12個共144個SM，所以可以計(jì)算出：

144（SM）*128(CUDA內(nèi)核)=18432(CUDA內(nèi)核)

144（SM）*1（RT核心）=144（RT核心）

144（SM）*4（Tensor核心）=576（Tensor核心）

144（SM）*4（TMUs紋理單元）=576（TMUs紋理單元）

12（GPC）*16（ROPs光柵單元）=192（ROPs光柵單元）

12（顯存控制器）*32bit（位寬）=384bit（顯存位寬）

和上一代第一款首發(fā)產(chǎn)品RTX 3090一樣，RTX 4090不是完整版核心，而是配備了這一代的第一款 Ada Lovelace GPU： AD102-300-A1。

NVIDIA AD102-300-A1 GPU架構(gòu)

▲盡管這張旗艦卡中使用的芯片并不是完整的核心，AD102依然擁有128 個流式多處理器 (SM) ，包含16384 個 CUDA 內(nèi)核。

RTX 4090的AD102-300-A1核心

▲RTX 4090使用了11個GPC單元構(gòu)成，9個GPC的SM為12個，2個GPC的SM為10個，共144個SM。所以可以計(jì)算出：

128（SM）*128(CUDA內(nèi)核)=16384(CUDA內(nèi)核)

128（SM）*1（RT核心）=128（RT核心）

128（SM）*4（Tensor核心）=512（Tensor核心）

128（SM）*4（TMUs紋理單元）=512（TMUs紋理單元）

11（GPC）*16（ROPs光柵單元）=176（ROPs光柵單元）

12（顯存控制器）*32bit（位寬）=384bit（顯存位寬）

Ada的圖形處理集群 (GPC)

▲Ada的圖形處理集群 (GPC)包含1個光柵引擎，6 個 TPC、12 個 SM 和 16 個 ROP。

GPC 是所有 AD10x Ada 系列 GPU 中占主導(dǎo)地位的高級硬件模塊，所有關(guān)鍵圖形處理單元都位于 GPC 中。每個 GPC 包括一個專用的光柵引擎、兩個光柵操作 (ROP) 分區(qū)，每個分區(qū)包含八個單獨(dú)的 ROP 單元和六個 TPC。每個 TPC 包括一個 PolyMorph 引擎和兩個 SM。

AD10x GPU 中的每個 SM 包含 128 個 CUDA 核心、1個 Ada 第三代 RT 核心、4個 Ada 第四代Tensor 核心、四個紋理單元、一個 256 KB 寄存器和 128 KB 的 L1/共享緩存。

Ampere 架構(gòu)的第2代RT Core

▲Ampere 架構(gòu)的第2代RT Core圖中，BVH 遍歷由 Box Intersection Engine （左側(cè)）加速，光線-三角形相交測試由 Box Intersection Engine 加速三角形相交引擎（右側(cè)）。通過兩者為光線追蹤功能提供專用資源，從而解放SM單元，使其騰出時間來執(zhí)行其他像素、頂點(diǎn)和計(jì)算著色任務(wù)。在使用綜合基準(zhǔn)測試以及真實(shí)游戲和應(yīng)用程序進(jìn)行測試時，Turing 和 Ampere GPU 中的 RT Core 已被證明是迄今為止處理 RT 工作負(fù)載的性能最高的引擎。

Ada 架構(gòu)的第3代RT Core

▲Ada 架構(gòu)的第3代RT Core，在繼承了第2代的兩個功能單元之外，新增了Opacity Micromap Engine （左下）和 Displaced Micro-Mesh Engine （右下）這兩個專用單元。

葉子或火焰等復(fù)雜形狀通常使用紋理中的 alpha 通道來表示透明度和不透明度的級別

▲在 Ada 的 RT Core 之前，開發(fā)人員可以通過將某些內(nèi)容標(biāo)記為不透明來將它們合并到光線追蹤場景中。當(dāng)葉子被光線擊中時，將調(diào)用著色器來確定如何處理相交，即使光線只是簡單地表征為命中或未命中。這會產(chǎn)生很大的計(jì)算資源開銷。具體來說，當(dāng)光線扭曲投射到非透明對象時，單個光線查詢可能需要多次著色器調(diào)用才能解析，而其他光線會立即終止。結(jié)果是資源開銷大以及效率低下。

為了有效處理此類內(nèi)容，NVIDIA 工程師在 Ada 的 RT Core 中添加了 Opacity Micromap Engine。不透明微圖是微三角形的虛擬網(wǎng)格，每個微三角形都具有不透明狀態(tài)，RT Core 使用該狀態(tài)直接解析與非透明三角形的光線交叉點(diǎn)。具體而言，交叉點(diǎn)的重心坐標(biāo)用于處理相應(yīng)的微三角形的不透明度狀態(tài)。不透明狀態(tài)可以是不透明的、透明的或未知的。如果不透明，則記錄并返回命中。如果透明，則忽略交叉點(diǎn)并繼續(xù)搜索交叉點(diǎn)。如果未知，則將控制權(quán)返回給 SM，調(diào)用著色器（“anyhit”）以編程方式解決交集。

新的Opacity Micromap Engine處理不透明度蒙版時，將其劃分為規(guī)則的三角形網(wǎng)格，用于報(bào)告光線/三角形交點(diǎn)的重心坐標(biāo)。這些網(wǎng)格的大小可以是1到1600萬個微三角形，每個微三角形有1-2bit。

▲考慮使用兩個三角形和一個 alpha 紋理描述的詳細(xì)楓葉（參見子圖 (a)）。不透明蒙版應(yīng)用于由 2 個三角形組成的楓葉。Opacity Micromap Engine評估葉子并確定哪些部分是不透明的、透明的或未知的，對應(yīng)葉子的不透明區(qū)域，最后紅色和藍(lán)色對應(yīng)混合不透明區(qū)域（未知）。在上面的示例中，Opacity Micromap Engine將微型三角形的 30 個標(biāo)記為透明，41 個標(biāo)記為不透明，57 個標(biāo)記為未知。這意味著超過一半的葉子被完全表征，并且超過一半的與這些三角形相交的光線要么錯過了葉子，要么明確地與葉子的內(nèi)部相交。結(jié)果是，Ada RT Core 無需調(diào)用任何著色器代碼即可完全表征這些光線，同時保留原始 Alpha 紋理的完整分辨率和保真度。不過當(dāng)處于未知狀態(tài)時，GPU會將控制權(quán)返回給SM著色器進(jìn)行解析。

▲與 Ampere 相比，Ada 的 Opacity Micromap Engine 與不透明蒙版減少了SM著色器工作負(fù)載，通常投射在 alpha通道中的測試幾何體上的陰影光線會看到最大的收益。 Ada 的不透明蒙版支持可以顯著增加場景中詳細(xì)幾何圖形的數(shù)量和保真度，從而提高真實(shí)感。借助這項(xiàng)新功能，它將 alpha 遍歷速度提高了 2 倍。開發(fā)人員可以非常快速地將不透明度值分配給不規(guī)則形狀的物體（如蕨類植物和柵欄）或半透明的物品（如火焰或煙霧），從而允許 Ada RT Core 直接對對 alpha 測試紋理進(jìn)行光線追蹤，而不是依賴 GPU 的 SM著色器單元。大幅提升對 alpha 測試紋理進(jìn)行光線追蹤的速度。

▲集成到 Ada RT Core 中的第2個新硬件單元是 Displaced Micro-Mesh Engine，旨在減少處理具有高水平幾何細(xì)節(jié)的復(fù)雜對象時傳統(tǒng)上所需的 BVH 構(gòu)建時間和存儲要求。有了這個新功能，NVIDIA開發(fā)了一種新的位移微網(wǎng)格原語來進(jìn)行光線追蹤。當(dāng)需要額外的幾何細(xì)節(jié)時，Displaced Micro-Mesh Engine可以根據(jù)需要動態(tài)生成額外的微三角形。與傳統(tǒng)渲染這些復(fù)雜對象相比，Displaced Micro-Mesh Engine將 BVH 構(gòu)建時間縮短了 10 倍，同時將 BVH 存儲需求降低了 20 倍。

Ada 流處理器 (SM)

▲與之前的Ampere一樣，Ada SM 分為四個分區(qū)，每個分區(qū)包含一個 64 KB 寄存器、一個 L0 指令緩存、一個 warp 調(diào)度程序、一個調(diào)度單元，16 個專門用于處理 FP32 操作的 CUDA 內(nèi)核（每個時鐘最多 16 個 FP32 操作），16 個可以處理 FP32 或 INT32 操作的 CUDA 內(nèi)核（每個時鐘 16 個 FP32 操作或每個時鐘 16 個 INT32 操作），一個 Ada 第4代Tensor 核心、四個加載/存儲單元和一個執(zhí)行先驗(yàn)和圖形插值指令的特殊功能單元 (SFU)。

Ada SM 包含 128 KB 的 1 級緩存。該緩存采用統(tǒng)一架構(gòu)，可根據(jù)工作負(fù)載配置為 L1 數(shù)據(jù)緩存或共享內(nèi)存。完整的AD102 GPU 包含 18432 KB 的 L1 緩存，而Ampere構(gòu)架中完整的GA102 僅有 10752 KB。

與 Ampere 相比，Ada 的 2 級緩存進(jìn)行了徹底改造。 AD102 配備了 98304 KB 的二級緩存，比 GA102 中的 6144 KB 提高了 16 倍。這會讓所有應(yīng)用程序都受益，而諸如光線追蹤之類的復(fù)雜操作最為受益。

▲Ada GPU升級的第4代Tensor 核心為現(xiàn)有 FP16、BF16、TF32 和 INT8 格式提供雙倍的吞吐量，其第4代Tensor 核心引入了對新 FP8 的支持。與 FP16 相比，F(xiàn)P8 的數(shù)據(jù)存儲需求減半，吞吐量翻倍。借助新的 FP8 格式，GeForce RTX 4090 可為 AI 推理工作負(fù)載提供 1.3 PetaFLOPS 的性能。

▲NVIDIA DLSS 3 是 AI 驅(qū)動圖形領(lǐng)域的革命性突破，可大幅提升性能。DLSS 3 由 GeForce RTX 40 系列 GPU 所搭載的全新第四代 Tensor Core 和光流加速器提供支持，可利用 AI 創(chuàng)造更多高質(zhì)量幀。

▲基于 Ada 架構(gòu)的全新顯卡配備了支持 AV1 編碼的全新第八代 NVIDIA 編碼器 (NVENC)，可為主播、廣播愛好者和視頻通話用戶帶來更多新的嘗試和體驗(yàn)。該技術(shù)的效率比 H.264 高 40%，這有助于主播在保持直播推流比特率不變的情況下，將畫面分辨率從 1080p 提高到 1440p，且畫質(zhì)依然穩(wěn)定。

開箱

▲ PNY是一家美商公司，中文名：必恩威，成立于 1985 年，是致力于消費(fèi)和商業(yè)級電子制造的全球技術(shù)領(lǐng)導(dǎo)者。PNY 擁有 30 多年為全球消費(fèi)者、B2B 和 OEM 提供服務(wù)的經(jīng)驗(yàn)。產(chǎn)品在北美、拉丁美洲、歐洲和亞洲的 50 多個國家和地區(qū)設(shè)有 20 家公司，在全球主要零售店、電子零售店、批發(fā)商和分銷商處銷售。產(chǎn)品組合包括種類繁多的 USB 閃存驅(qū)動器、閃存卡、PC 內(nèi)存升級、固態(tài)驅(qū)動器、NVIDIA? 顯卡和 HP 閃存產(chǎn)品。憑借面向移動、數(shù)字成像、計(jì)算和游戲解決方案的產(chǎn)品。

其實(shí)我對PNY的了解，還是因?yàn)樵诒泵赖腷estbuy海淘Quadro專業(yè)顯卡，PNY在北美是Quadro和Tesla的獨(dú)家代理商，這個定位非常類似中國的麗臺，2020年開始銷售的Geforce RTX 3000系列消費(fèi)級顯示卡基本和國內(nèi)麗臺銷售的外形是非常類似的，因?yàn)槎际荘alit代工出品，2021年底開始獨(dú)立研發(fā)生產(chǎn)顯示卡，那么RTX 4000就是PNY獨(dú)立研發(fā)生產(chǎn)顯示卡的開山之作。

▲而XLR8 Gaming系列就是PNY所規(guī)劃的游戲系列產(chǎn)品，當(dāng)然PNY GeForce RTX 4090 24GB OC XLR8 Gaming Verto EPIC-X RGB? TF就是PNY目前出品的消費(fèi)級旗艦顯卡。

▲包裝正面

▲包裝背面

▲包裝側(cè)面

▲同比其他品牌的RTX3090包裝盒，PNY的包裝體積要小不少

▲開箱

▲原封本體

▲原封標(biāo)簽

▲這是靜電袋的標(biāo)簽，和盒子上的標(biāo)簽以及顯卡上的標(biāo)簽，配合成三碼合一。其中D43724是PNY獨(dú)有的工廠碼。

▲附件全家福

▲1組 16-Pin 轉(zhuǎn) 四組 8-Pin的供電排線，官方稱之為PCIe5 12VHPWR Adapter。

▲這種帶有NVIDIA標(biāo)的4 x 8P轉(zhuǎn)12VHPWR的線其實(shí)我不建議使用，因?yàn)檫@種線材全部是由NVIDIA配送的套料，每一家都是一樣的，因?yàn)榍捌谟袌?bào)道NVIDIA這批轉(zhuǎn)接線有嚴(yán)重的焊接方式的質(zhì)量問題，容易導(dǎo)致顯卡與轉(zhuǎn)接線的12VHPWR位燒熔，所以這里我極力建議大家不要使用這條線，具體分析我會放在文章結(jié)尾部分。

▲附贈的一組顯卡支撐架，官方命名為：VGA Support Kits，來自聯(lián)力代工制造。

▲安裝方式如上圖

▲顯卡正面使用了三個100mm雙滾珠環(huán)型風(fēng)扇

▲與傳統(tǒng)90mm風(fēng)扇相比增加了40%以上的風(fēng)量，風(fēng)壓提高55%。

▲顯卡背面使用了沖壓成型鋁制金屬背板

▲顯卡背板的一塊做了鏤空設(shè)計(jì)，方便風(fēng)扇將熱風(fēng)吹至機(jī)箱內(nèi)部。

▲顯卡頂部設(shè)計(jì)了一組XLR8的ARGB燈效

▲由于這次的RTX 4090各家都采用了短PCB設(shè)計(jì)，所以16PIN供電設(shè)計(jì)在短PCB的一側(cè)上方，覆蓋上全長度的散熱器，就會顯得外接供電貌似設(shè)計(jì)在顯卡的中間部分。

▲顯卡底部

▲顯卡的厚度是71.1mm，標(biāo)準(zhǔn)的3.5槽厚度。接口部分為3x DisplayPort 1.4, 1x HDMI 2.1

▲顯卡前部可以看出使用了4熱管穿Fin。

▲這張顯卡的體積控制在331.8 x 136.8 x 71.1mm，長度比公版的創(chuàng)始者310mm略長，但是短于其他AIC的同型號產(chǎn)品。

▲顯卡體積的兼容性對比

拆解

▲我直接對這張顯卡進(jìn)行了拆解

▲沖壓全鋁背板

▲散熱器本體

▲散熱使用了8根熱管

▲接觸底座使用了Vapor-Chamber真空腔均熱板設(shè)計(jì)。

▲PCB正面

▲PCB背面

PNY的這張卡的PCB是公版PG139-SKU330

▲這張顯卡全部的MOSFET使用都是OnSemi NCP302150 DrMOS，分別用于GPU和顯存供電；額定電流均為50A 。

▲GPU核心的PMW芯片是uPI uP9512U 。

▲該控制器管理14 相GPU核心供電。

▲顯存供電PMW芯片是UPI uP9512R

▲該控制器管理3相顯存供電。

▲GDDR6X 內(nèi)存芯片由美光制造，型號為 D8BZC，解碼為 MT61K512M32KPA-21:U。它們被指定以 1313 MHz（21 Gbps 有效）運(yùn)行。

▲GPU核心是AD102-300-A1

▲HOLTEK HT32F52352芯片控制燈效以及風(fēng)扇轉(zhuǎn)速。

▲GSTEK GS9216是一顆12A降壓芯片。

▲UPI US5650Q是一顆四通道電壓電流監(jiān)控芯片，監(jiān)測PCB上四顆SHUNT RESISTOR，2顆R002和1顆R005在12VHWPR附近, 1顆R005在金手指附近。

這個供電的思路看下來，感覺PNY的設(shè)計(jì)比較關(guān)注默認(rèn)效能穩(wěn)定性，沒有大量的堆料供應(yīng)超頻需求。設(shè)計(jì)方案和Palit類似。

既然都是PG139-SU330公版參考設(shè)計(jì)，為什么各家的PCB有明顯的不同，包括電源的相數(shù)以及供電的方案。其實(shí)來自igor'sLAB的主編Igor Wallossek早就發(fā)表過他的意見，在Ada設(shè)計(jì)之初，NVIDIA考慮的仍然是使用SAMSUNG 8N制程，所以給與板卡廠商的散熱以及電路設(shè)計(jì)參考指南都是以600W散熱規(guī)模以及供電規(guī)模呈現(xiàn)的，因?yàn)檎麄€產(chǎn)品的規(guī)劃確實(shí)需要幾個月時間，但是AMD的NAVI 31確定下來使用TSMC 5-6nm混合工藝制造后，NVIDIA估計(jì)是不淡定了，立即改變Ada的制程，直接轉(zhuǎn)投TSMC 5nm改良版4N，確實(shí)TSMC 4N面對AMD確定的TSMC 5-6nm混合制程是存在優(yōu)勢的，同時由于一些市場戰(zhàn)略問題，NVIDIA并沒有向板卡廠商透露工藝變更事宜，直到AD102出來，NVIDIA通知板卡廠商RTX 4090的TGP和散熱設(shè)計(jì)為450W才得到確認(rèn)。

ASUS ROG Strix GeForce RTX 4090 OC

▲這時候板卡廠商更換方案已經(jīng)來不及了，于是就用600W的電路設(shè)計(jì)+散熱方案直接推出了RTX 4090的產(chǎn)品，可以理解成PG139-SU330公版參考設(shè)計(jì)的600W加強(qiáng)版。

NVIDIA Geforce RTX 4090 Founders Edition

▲其實(shí)對于NVIDIA自己的FE版本也是早早設(shè)計(jì)好了600W的電路PCB，就是PG139-SU330公版的600W變種加強(qiáng)版，但是上市時候使用了450W的散熱模塊，原先計(jì)劃的三風(fēng)扇FE散熱方案可以移交到RTX 4090Ti上去了。

Palit GeForce RTX 4090 GameRock OC

▲在投片TSMC 4N之后NVIDIA在市場方面向板卡廠商出售方案的時候就完全轉(zhuǎn)向了450W的PG139-SU330公版設(shè)計(jì)，包括供電套料都一并提供，并極力要求廠商這樣去做，原因就是在面對未來的NAVI-31的時候，NVIDIA希望表現(xiàn)的是一個比對方優(yōu)秀的能耗比，而不是一個多燒了33%TGP功耗性能多出5%的產(chǎn)品，諸如Palit抑或PNY就是屬于后期被NVIDIA規(guī)劃為450W產(chǎn)品線的主推廠商。

所以這一代產(chǎn)品，PG139-SU330公版參考設(shè)計(jì)是600W版本還是450W版本，完全取決于NVIDIA介入生產(chǎn)設(shè)計(jì)的時間線，在轉(zhuǎn)投TSMC 4N之前，都是600W方案，在投了TSMC 4N之后都是450W方案。

那么是不是600W版本的PCB以及散熱設(shè)計(jì)就會強(qiáng)很多呢？這取決于板卡廠商的慣性思維，因?yàn)镾AMSUNG 8N制程Ampere的GPU核心提供給廠商的時候是存在分級的，分為30%的BIN0，60%的BIN1，10%的BIN2。這是由三星的良率問題決定，所以產(chǎn)生了BIN2這樣的Sorting GPU核心，優(yōu)秀的核心會提供給核心AIC裝備，比如御三家這些，所以御三家的旗艦版會比下游廠家的核心在同樣電壓下BOOST到更高更夸張的頻率，這讓超公版PCB和散熱設(shè)計(jì)變得非常有價(jià)值。但是TSMC 4N卻不提供所謂的Sorting GPU核心，這次只有BIN1，沒有BIN0和BIN2，每一家拿到的核心體制都基本一致，沒有特別優(yōu)秀的也沒有特別差的，這就讓想做超公版的廠家特別頭疼，因此，大家看評測所了解的600W滿載的效能也并沒有特別多的效能提升，能耗比完全沒有優(yōu)勢。

測試平臺

電源適配

▲為了盡可能穩(wěn)定有效的完成測試任務(wù)，電源這次使用了Seasonic Prime TX-1600

▲Seasonic Prime TX-1600包裝

▲80PLUS鈦金認(rèn)證，電源原生支持兩個PCIe5 12VHPWR供電接口。

▲開箱

▲附件全家福

▲線材包1

▲線材包2

▲PCIe5 12VHPWR供電線

▲PCIe5 12VHPWR供電接口部分

▲海韻的PCIe5 12VHPWR供電線直接定義為600W輸出。

▲電源本體背面

▲電源本體正面

▲電源本體側(cè)面

▲電源模組接口

▲45°視角

京東

Seasonic 海韻 PRIME-TX 鈦金牌（94%）全模組ATX電源電腦電源 1600W3599元實(shí)時價(jià)格8小時前已更新去購買

測試平臺

【CPU】: AMD Ryzen 7 5800X

【主板】: ASRock X570S PG Riptide

【內(nèi)存】: Lexar THOR DDR4-3600 16GB X2(White)

【硬盤】: LEXAR NM800 1TB M.2 PCIe Gen 4X4 SSD

【顯卡】: PNY RTX 4090 OC XLR8 Gaming Verto

【散熱】: Thermalright Forzen Magic 240 ARGB

【機(jī)箱】: SilverStone RM42-502

【電源】: Seasonic TX-1600

【系統(tǒng)】: Windows 11 x64 WorkStation 21H2

【系統(tǒng)】: Ubuntu 18.04.6 x64

▲視角1

▲點(diǎn)亮的光效

基本情況

▲GPUZ默認(rèn)參數(shù)

▲閑時，使用HWINFO對GPU功耗、GPU熱點(diǎn)溫度、GPU溫度以及顯存結(jié)溫進(jìn)行了監(jiān)控，可以發(fā)現(xiàn)：

功耗=14.834W，

GPU熱點(diǎn)溫度=45.8°C

GPU溫度=36.9°C

顯存結(jié)溫=40°C

▲我們進(jìn)行3DMARK Speed Way的壓力測試，本測試一共20輪，我們在第17輪開始統(tǒng)計(jì)，榨出當(dāng)前最高的TGP和溫度并使用HWinfo監(jiān)控。

▲運(yùn)行3DMARK Speed Way壓力測試是因?yàn)橐恢碧幱贕PU 100%滿載狀態(tài)：

功耗=443.946W，

GPU熱點(diǎn)溫度=79.9°C

GPU溫度=70.3°C

顯存結(jié)溫=80°C

這基本是目前現(xiàn)有手段能榨出的最大表現(xiàn)力。

▲回到HWINFO監(jiān)控頁面去復(fù)盤，了解一下這張卡的一些特性：

關(guān)于GPU功耗，最低9.133W，最高445.763W，基本說明這張卡的功耗區(qū)間，看起來被鎖450W TGP。

GPU頻率在待機(jī)時候穩(wěn)定在210MHz，滿載時候達(dá)到2820MHz。

顯存頻率在待機(jī)時候穩(wěn)定在101.3MHz，滿載時候達(dá)到2625.5MHz。

GPU過熱限制=84°C，說明整個顯卡的散熱設(shè)計(jì)是為了把GPU溫度壓制在84°C以內(nèi)。

GPU風(fēng)扇1是三顆風(fēng)扇中的左右兩顆并聯(lián)，待機(jī)基本不轉(zhuǎn)，測試時候轉(zhuǎn)速最大達(dá)到1713RPM，但這只是風(fēng)扇全速轉(zhuǎn)速的49%。

GPU風(fēng)扇2是三顆風(fēng)扇中的中間一顆，在待機(jī)時候基本不轉(zhuǎn)，測試時候轉(zhuǎn)速最大達(dá)到1721RPM，但這只是風(fēng)扇全速轉(zhuǎn)速的49%。

▲想讓風(fēng)扇全速，使用PNY的VelocityX軟件就可以做到。

▲將風(fēng)扇這里的自動關(guān)閉，轉(zhuǎn)速拉到100%即可達(dá)到最大轉(zhuǎn)速3086RPM。

下面看一下超頻效果，

▲超頻之前跑了一個3DMARK TIME SPY EXTREME測試，GPU分?jǐn)?shù)19472

▲隨后我直接將GPU核心加了200MHz，

▲進(jìn)行3DMARK TIME SPY EXTREME測試，GPU分?jǐn)?shù)19912

▲HWINFO監(jiān)控?cái)?shù)據(jù)的GPU功耗依然牢牢被鎖在450W以內(nèi)。

▲比較一下兩個測試，差異主要是CPU核心頻率boost從2790MHz越遷到2985MHz，實(shí)際功耗沒有增加，溫度也沒有增加。所以也不用動輒對boost核心頻率達(dá)到3000MHz的600W超級公版垂涎三尺，其實(shí)哪怕450W TGP的RTX 4090往上隨便拉個200-250核心頻率就隨意可以達(dá)到3000MHz的boost核心頻率。

▲這說明這次的AD102-300-A1核心在不增加功耗的情況下是留有一定余量的性能可以壓榨的，但是空間不大，200-250MHz，一旦超過這個范圍，就需要BIOS破除Maximum Power Limit 450W的限制。

▲關(guān)于RGB特效，VelocityX提供了多種選擇，下面展示幾張我拍攝的燈光效果。

視頻

▲基本情況部分測試到此結(jié)束。

對比測試

▲從左往右，依次是PNY RTX 4090 Verto、影馳RTX 3090 Ti星耀以及七彩虹RTX 3090火神

▲三款產(chǎn)品同比

▲厚度上PNY RTX 4090略厚，長度和影馳RTX 3090 Ti星耀基本一致。

DLSS3 測試

▲NVIDIA GeForce RTX 40系列顯卡的一大變化就是新增了對DLSS 3技術(shù)的支持，DLSS 3在前代DLSS2的基礎(chǔ)上，通過(OFA)光流加速推斷下一幀生成的目標(biāo)畫面，使傳統(tǒng)CUDA算力得到極大的節(jié)省，讓GPU在應(yīng)對高分辨率實(shí)時渲染游戲時可以更加游刃有余，與不使用DLSS相比，理論上游戲性能的提升可高達(dá)4倍。

▲DLSS 3由于Frame Generation的加入，它的理論幀數(shù)性能能達(dá)到原先DLSS 2的雙倍，這使得GeForce RTX 40系顯卡能夠以更小的壓力用4K分辨率高畫質(zhì)運(yùn)行所有支持DLSS 3的游戲，同時距離流暢體驗(yàn)8K游戲也更進(jìn)一步。

▲目前有超過35款游戲和應(yīng)用宣布即將支持DLSS3。

DLSS3 測試-Cyberpunk 2077

《Cyberpunk 2077》DLSS3設(shè)置

▲DLSS 3的相關(guān)測試使用《Cyberpunk 2077》完成，雖然選擇游戲自帶的BENCHMARK進(jìn)行測試，但由于DLSS 3應(yīng)用了新技術(shù)，當(dāng)下游戲自帶的幀數(shù)記錄功能并不能精準(zhǔn)地記錄下開啟DLSS 3之后的游戲幀數(shù)。因此在DLSS 3游戲中，雖然使用游戲自帶的BENCHMARK進(jìn)行測試，但實(shí)際幀數(shù)以NVIDIA的FrameView工具為準(zhǔn)。

▲開啟光追測試，我們可以發(fā)現(xiàn)，開啟DLSS 2之后的游戲性能幀數(shù)已經(jīng)相當(dāng)可觀，然而當(dāng)開啟DLSS 3之后，游戲性能在DLSS 2的基礎(chǔ)上又提升了一大截，與關(guān)閉DLSS相比，在4K分辨率下開啟DLSS 3質(zhì)量可以帶來170%的性能提升，2K分辨率下可以帶來145%的性能提升。

DLSS對比測試

DLSS對比測試-FAR CRY 6

DLSS對比測試-Shadow of the Tomb Raider

生產(chǎn)力測試

生產(chǎn)力測試環(huán)節(jié)使用了Puget Systems的三個測試腳本進(jìn)行測試：

生產(chǎn)力測試-Adobe After Effects 22.4

▲本測試以Adobe After Effects 22.4為測試載體

▲以PugetBench for After Effects 0.95.2為工具基準(zhǔn)進(jìn)行測試

本測試涉及到了許多不同的項(xiàng)目，其中包括一個專用的“GPU 壓力”測試，該測試旨在往 GPU 上施加盡可能多的負(fù)載，同時仍保持在某人在現(xiàn)實(shí)世界中可能實(shí)際執(zhí)行的范圍內(nèi)。在 After Effects 等應(yīng)用程序中查看 GPU 性能通常是檢查 GPU 承受重負(fù)載的極端情況的情況，因此通過每個 GPU 的 After Effects 基準(zhǔn)測試中看到的整體性能開始，GPU 分?jǐn)?shù)是根據(jù)“GPU Stress”組合的性能計(jì)算得出的，該組合旨在將盡可能多的負(fù)載置于 GPU 上，同時最大限度地減少 CPU 作為瓶頸，可以很好地顯示 After Effects 中不同 GPU 之間的最大性能增量。

GPU分?jǐn)?shù)的基準(zhǔn)是以NVIDIA GeForce RTX 3080 10GB為100分參考基準(zhǔn)。

NVIDIA GeForce RTX 3080 10GB

GPU分?jǐn)?shù)：100

▲測試數(shù)據(jù)匯總

生產(chǎn)力測試-Adobe Premiere Pro 22.6.1

▲本測試以Adobe Premiere Pro 222.6.1為測試載體

▲以PugetBench for Premiere Pro 0.95.3為工具基準(zhǔn)進(jìn)行測試。

這個基準(zhǔn)測試通過4K和8K分辨率以及29.97和59.94 FPS的各種編解碼器來研究實(shí)時回放和導(dǎo)出性能。對于GPU測試使用專用的“重載GPU效果”單獨(dú)向GPU施加盡量多的壓力，使其超出普通Premiere Pro用戶的工作范圍來進(jìn)行測試。

測試的剪輯素材 (59.94 FPS)素材分辨率以及編碼器包含：4K H.264 150mbps 8-bit (59.94FPS)、4K ProRes 422、4K RED、8K RED、8K H.265 100Mbps。

對于每種類型的測試素材，進(jìn)行四種測試：

標(biāo)準(zhǔn) - 兩個 59.94FPS 片段串聯(lián)，應(yīng)用 Lumetri Color 效果

2x Forward - 四個 59.94FPS 剪輯，在 119.88FPS 序列中將 Lumetri 顏色設(shè)置為 200% 速度，以模擬以 2 倍速度播放時的性能。

4x Forward - 8 個 59.94FPS 剪輯，在 239.76FPS 序列中將 Lumetri 顏色設(shè)置為 400% 的速度，以模擬以 4 倍速度播放時的性能。

MultiCam - 在多機(jī)位序列中跨四六個軌道的多個剪輯。在“多相機(jī)”顯示模式下測試播放。

這些測試都用于全回放分辨率的實(shí)時回放性能測試。

標(biāo)準(zhǔn)測試還使用“Youtube 2160p 4K 超高清”預(yù)設(shè)（H.264、4K、40mbps）以及導(dǎo)出到 4K ProRes 422HQ 8-bpc 來測試其導(dǎo)出性能。

關(guān)于GPU有一個“Heavy GPU Effects”測試，使用：

串聯(lián)的 Twp ProRes 422 剪輯，每個剪輯之間有交叉溶解

高級效果：Lumetri Color、Ultra Key、Sharpen、Gaussian Blur、Basic 3D、Directional Blur 和 VR Digital Glitch。

極致效果：Lumetri Color、Ultra Key、Sharpen、Gaussian Blur、Basic 3D、Directional Blur、VR Digital Glitch 和 VR De-Noise。

通過導(dǎo)出到 ProRes 422HQ 來衡量性能。

GPU 分?jǐn)?shù)基準(zhǔn)是以NVIDIA GeForce RTX 3080 10GB為100分參考基準(zhǔn)：

NVIDIA GeForce RTX 3080 10GB

GPU分?jǐn)?shù)：100

▲測試數(shù)據(jù)匯總

生產(chǎn)力測試-DaVinci Resolve Studio 18.0.2

▲本測試以BlackMagic DaVinci Resolve Studio 18.0.2為測試載體，以PugetBench for DaVinci Resolve 0.92.3為工具基準(zhǔn)進(jìn)行測試。

本基準(zhǔn)測試主要使用各種編解碼器以 4K 和 8K（僅限擴(kuò)展預(yù)設(shè)）分辨率、OpenFX 以及 Fusion 中的性能進(jìn)行渲染。

測試的剪輯素材 (59.94 FPS)素材溯源自以下兩家自媒體提供的樣片：包含以下分辨率和編解碼器：

4K H.264 150mbps 8-bit、4K ProRes 422、4K RED、8K RED以及8K H.265 100mbps

GPU 效果部分側(cè)重于 OpenFX 和降噪，包含以下效果：

Temporal NR x3 - 2 Frames Better

Temporal NR - 2 Frames Better

Film Grain

Spatial NR - Better

Lens Blur x5

Lens Flare

Optical Flow - 50% Enhanced Better

Face Refinement

▲測試數(shù)據(jù)匯總

最后需要說明的是，本次測試的剪輯素材來自以下兩家自媒體：

▲4K和8K RED剪輯視頻來自老萊的工作室，這些剪輯也已轉(zhuǎn)碼以創(chuàng)建H.265和ProRes 422剪輯。Linus Media Group是老萊的公司，在YouTube上提供了流行的 LinusTips和 TechLinked頻道。

▲Neil Purcell是倫敦著名的照明攝影師，在廣播電視領(lǐng)域擁有超過25年的經(jīng)驗(yàn)。從事各種各樣的作品；從戲劇到木偶，現(xiàn)場新聞和事實(shí)，兒童節(jié)目，燈光娛樂，真人秀，外部廣播，重大體育賽事，音樂演唱會，流行視頻，企業(yè)電影和商業(yè)廣告。圖中Neil Purcell（燈光攝影師/攝影操作員）正在以他的松下 GH5 拍攝 4K H.264 素材。本次測試使用的4K H.264素材來源于他的剪輯作品。

深度學(xué)習(xí)

RTX 4090 具有576個第4代Tensor核心，RTX 3090 Ti 具有336個第3代Tensor核心，RTX 3090 具有328個第3代Tensor核心，理論上RTX 4090的Tensor核心不僅有數(shù)量上的優(yōu)勢而且有迭代的優(yōu)勢。這對深度學(xué)習(xí)來說是個非常大的利好。不過RTX 4090實(shí)在太新了可能需要點(diǎn)時間才能讓深度學(xué)習(xí)的周邊支持跟上，正好CUDA Toolkit 11.8趕著發(fā)布了，所以直接使用了NVIDIA的NGC 容器系統(tǒng)進(jìn)行測試。

▲測試系統(tǒng)

Ubuntu 22.04 Linux

NVIDIA Enroot 3.4

來自NVIDIA NGC 的容器化應(yīng)用程序

TensorFlow 1.15.5 ML/AI 框架標(biāo)簽：nvcr.io/nvidia/tensorflow:22.09-tf1-py3

PyTorch 1.13.0a0 ML/AI 框架標(biāo)簽：nvcr.io/nvidia/pytorch:22.09-py3

深度學(xué)習(xí)-TensorFlow ResNet50

▲ TensorFlow 1.15.5版本是 NVIDIA 維護(hù)的，能提供更好的性能。基準(zhǔn)是訓(xùn)練 100 Step的 ResNet 50 卷積神經(jīng)網(wǎng)絡(luò) (CNN)。結(jié)果是以每秒處理的圖象數(shù)來決定。精度可選擇FP32 和 FP16 。每秒處理的圖象數(shù)越多說明性能越好。

命令行：

CUDA_VISIBLE_DEVICES=0 python resnet.py --layers=50 --batch_size=128 --precision=fp16CUDA_VISIBLE_DEVICES=0 python resnet.py --layers=50 --batch_size=128 --precision=fp32

▲測試數(shù)據(jù)匯總

深度學(xué)習(xí)-PyTorch Transformer

▲基準(zhǔn)測試使用 PyTorch 1.13 在帶有 CUDA 的 Wikitext-2 的神經(jīng)網(wǎng)絡(luò)上對Transformer 模型進(jìn)行 6 epoch 的訓(xùn)練，完成時間越短，說明性能越好。

命令行：

time CUDA_VISIBLE_DEVICES=0 python main.py --cuda --epochs 6 --model Transformer --lr 5 --batch_size 640

▲測試數(shù)據(jù)匯總

值得注意的是PyTorch和TensorFlow的迭代支持很快，一些優(yōu)化一定會持續(xù)跟進(jìn)Ada構(gòu)架進(jìn)行優(yōu)化的，所以預(yù)留了未來可期許的深度學(xué)習(xí)性能提升空間。

硬件兼容性

其實(shí)我對測試平臺不太追新，最主要的問題就是怕不兼容，結(jié)果還是遇到了不兼容的情況，最后得到了解決：

測試平臺我選用的是ASRock X570S PG Riptide主板以及AMD Ryzen 7 5800X，沒有選用INTEL 12和13代平臺以及AMD Ryzen 7000系列平臺最主要的原因是因?yàn)橛胁糠值臏y試在Ubuntu 18.04.6 LTS下進(jìn)去，對于Linux平臺而言，支持如上新平臺發(fā)揮效能需要更新內(nèi)核到5.17-5.22以上，存在一些未知且不可預(yù)測的可能性，求穩(wěn)所以使用了成熟的平臺。

▲ASRock X570S PG Riptide包裝

▲ASRock X570S PG Riptide附件一覽

▲ASRock X570S PG Riptide本體

▲安裝AMD Ryzen 7 5800X，散熱器選用的是Thermalright Forzen Magic 240 ARGB。

▲ Thermalright Forzen Magic 240 ARGB包裝

▲Thermalright Forzen Magic 240 ARGB本體1

▲Thermalright Forzen Magic 240 ARGB本體2

▲SSD選擇的比較穩(wěn)健的LEXAR NM800 1TB M.2 PCIe Gen 4X4 ，為了提高兼容性選用了主流的IG5236主控+美光B47R NAND。

▲SSD本體正面

▲SSD本體背面

▲安裝設(shè)備在M.2-1 CPU PCIe Lane槽位。

▲CrystalDiskMark 8.0.24的持續(xù)讀寫使用QD32T1的默認(rèn)設(shè)置，隨機(jī)讀寫使用QD32T16的條件，可以非常接近官標(biāo)所標(biāo)識的UP TO的最大值：

Sequential Read [持續(xù)讀取](Q=32,T=1) : 7459 MB/s 超越官標(biāo)

Sequential Write [持續(xù)寫入](Q=32,T=1) : 5738 MB/s 接近官標(biāo)

Random Read 4KiB [4K隨機(jī)讀取](Q=32,T=16) : 399K IOPS 接近官標(biāo)

Random Write 4KiB[4K隨機(jī)寫入] (Q=32,T=16) : 1013K IOPS 遠(yuǎn)超官標(biāo)

評估了下，基本可以認(rèn)為達(dá)到了官標(biāo)的性能。

內(nèi)存選擇的是Lexar THOR DDR4-3600 16GB X2(White)

▲DRAM本體正面

▲DRAM擺拍2

▲上機(jī)

▲安裝內(nèi)存在DIMM 2和DIMM 4。

▲上機(jī)用臺風(fēng)看了下，美光F-Die，顆粒編號D8CJV，美光里的內(nèi)部編號為MT40A2G8SA-062E:F，原生DDR4-3200的顆粒，SPD里有DDR4-3600 18-22-22-42 1.35V的XMP參數(shù)以及DDR4-3200 22-22-22-52 1.2V的JEDEC參數(shù)。

▲機(jī)箱選用的是一款工作站機(jī)箱SilverStone RM42-502

▲這是一款可以通過導(dǎo)軌直接上機(jī)柜的RACK機(jī)箱

▲支持240-280水冷。打開前門可以看到兼容水冷的風(fēng)扇進(jìn)風(fēng)位

▲SilverStone RM42-502的特點(diǎn)是可以通過附件里面的轉(zhuǎn)換件變成塔式工作站機(jī)箱

▲SilverStone RM42-502的塔式形態(tài)--開門

▲SilverStone RM42-502的塔式形態(tài)--關(guān)門，前門鑰匙是工作站機(jī)箱的標(biāo)配。

▲組裝好硬件

問題一

▲第一件事情發(fā)現(xiàn)點(diǎn)不亮。。。。。。如圖所示顯示器無顯示，但是機(jī)器運(yùn)行則一切正常。

▲ASRock X570S PG Riptide這種上市一年多的成熟產(chǎn)品竟然必須需要更新2022年10月22日最新2.20版本BIOS才可以支持RTX 4090，所以當(dāng)發(fā)現(xiàn)點(diǎn)不亮RTX 4090的時候不用慌，先去用別的顯卡點(diǎn)亮系統(tǒng)升級一個最新的BIOS。

問題二

▲第二個問題，要清楚SilverStone RM42-502是一個支持ETAX雙路主板的工作站服務(wù)器機(jī)箱，不僅寬大且做工精良。

▲規(guī)格是430mm (W) x 176mm (H) x 468mm (D),寬度是430mm。

▲就這個規(guī)格的機(jī)箱，在安裝了前置240水冷之后，塞進(jìn)去331mm長度的PNY GeForce RTX 4090 24GB OC XLR8也已經(jīng)比較緊湊了，機(jī)箱在不安裝前置水冷情況下允許安裝的顯卡最大長度為426mm，一般普通水冷排厚度為27mm，12025規(guī)格水冷風(fēng)扇厚度為25mm，安裝完水冷僅剩下374mm的長度空間，依然足夠裝下目前在售的任意品牌型號的RTX 4090！如果你正在為找一款適合RTX 4090的做工精良的工作站機(jī)箱而煩惱，如果你能夠接受無ARGB的機(jī)箱內(nèi)環(huán)境的話，SilverStone RM42-502絕對是您正確的選擇！

但是市面上大多數(shù)的ATX機(jī)箱顯卡限制長度都在350mm以內(nèi)，這意味著，如果你購買RTX 4090顯示卡，顯卡的長度決定了你是否需要更換一個更大的機(jī)箱。所以這時候長度更短的RTX 4090的機(jī)箱兼容適配性當(dāng)然是更強(qiáng)的。

問題三

▲第三個問題，如果使用了Seasonic TX-1600原配的12VHPWR線材進(jìn)行安裝，如果發(fā)生過度彎曲，還是有可能發(fā)生以下情況：

▲因?yàn)檫^度彎曲發(fā)生的線材接頭脫落情況，

▲PCI-SIG組織早就通報(bào)了因?yàn)?2VHPWR的線材因?yàn)樘蔡值脑蛟谶^度彎曲的時候造成接頭松動甚至脫落，和顯卡12VHPWR接頭部分發(fā)生電阻值過高，發(fā)熱嚴(yán)重最終造成12VHPWR燒毀的問題。

現(xiàn)在問題來了，機(jī)箱的能蓋上側(cè)板能容納的最大顯卡高度為156mm，而顯卡本身的高度為136.8mm，如果要蓋上側(cè)板，就必須在19mm的空間內(nèi)進(jìn)行12VHPWR線材彎折，這其實(shí)還是有風(fēng)險(xiǎn)。對于海韻電源而言，其實(shí)還有終極解決方案來解決這個問題。

▲海韻為解決彎曲問題出品了一款新的12VHPWR模組線，符合PCIe 5.0供電標(biāo)準(zhǔn)，兼容ATX 3.0，使用16AWG高規(guī)格線徑，耐高電流合金銅端子，可支持高達(dá)600W功率輸出。電源直連顯卡供電，可降低轉(zhuǎn)接帶來的故障風(fēng)險(xiǎn)，為玩家?guī)砀踩€(wěn)定的供電方案。另外，該模組線采用了新的模組線材，壓紋工藝如編織質(zhì)感，比一般的模組線更柔軟，更有利于玩家走線。

▲海韻這款12VHPWR模組線適配于其PRIME和FOCUS系列850W及以上型號，可選黑色或白色，但與其他品牌并不適配。如果玩家使用的是國行在保的海韻電源，每個電源SN可免費(fèi)申請一次，得到這款12VHPWR模組線。

▲1000W及以上的海韻電源需提供RTX 40系列顯卡的購買憑證，850W及以上的海韻電源需提供RTX 3090 Ti顯卡的購買憑證，另外玩家需要提供一張電源與顯卡的合照（電源SN清晰可見），默認(rèn)發(fā)黑色，白色需備注。玩家可將相關(guān)資料發(fā)送到官方郵箱cn.support@seasonic.com免費(fèi)申請，郵費(fèi)自理，以順豐到付寄出。

問題四

▲第四個問題，第一批次NVIDIA配給顯卡生產(chǎn)商的1組 16-Pin轉(zhuǎn)4組 8-Pin的供電排線，官方稱之為PCIe5 12VHPWR Adapter，存在嚴(yán)重質(zhì)量問題。igor'sLAB 發(fā)表了一項(xiàng)關(guān)于 Nvidia 12VHPWR 適配器的研究，不建議使用此適配器！

▲reddit有個帖子專門持續(xù)匯報(bào)發(fā)生的轉(zhuǎn)接線燒毀顯卡供電接口事件，且持續(xù)更新。到2022年10月30日為止因NVIDIA配送的16-Pin轉(zhuǎn)4組 8-Pin的12VHPWR線材燒毀顯卡接口事件為12例，均為TGP大于550W的RTX 4090。目前無法確定NVIDIA要求近期發(fā)行的RTX 4090新版TGP功耗鎖定為450W是否與此有關(guān)。

▲NVIDIA配送的16-Pin轉(zhuǎn)4組 8-Pin的12VHPWR線材總共有 4 根 14AWG 粗線分布在總共 6 個觸點(diǎn)上，兩條外部引線分別焊接到一個引腳上，中間的兩條引線分別焊接到兩個引腳上。

▲焊料底座是僅 0.2mm的薄銅底座，每根進(jìn)線寬度為 2 mm，因此中間連接的每對寬度為4mm。

▲將一根甚至兩根14AWG 電線焊接到它上面是活動的，彎曲情況下非常容易造成脫落。

▲目前上市的大多數(shù)的RTX 4090都是在600W TGP下運(yùn)行，在這電流強(qiáng)度下，因?yàn)閺澢鷮?dǎo)致的不穩(wěn)定且活動的焊接觸點(diǎn)引腳電阻值上升，迅速燒毀顯示卡以及轉(zhuǎn)接線的12VHPWR接口部分。

▲因?yàn)樵缙诘腞TX 3090Ti配送的1組12-Pin轉(zhuǎn)3組 8-Pin的供電排線使用了相同的設(shè)計(jì)，可能是因?yàn)?50W TGP功耗輸入電流較低并未報(bào)告燒毀RTX 3090Ti的情況，但是這次有用戶害怕使用RTX 4090配送的16-Pin轉(zhuǎn)4組 8-Pin的12VHPWR線材，轉(zhuǎn)而使用RTX 3090Ti配送的12-Pin轉(zhuǎn)3組 8-Pin的12VHPWR線材，一樣發(fā)生了燒毀情況。目前的報(bào)告是兩例。順帶說一下PNY GeForce RTX 4090 24GB OC XLR8 Gaming Verto EPIC-X RGB? TF目前是和RTX 3090Ti一樣的450W TGP功耗設(shè)計(jì)。

總結(jié)

因?yàn)槭掷餂]有其他的RTX 4090顯示卡，所以同類比測試是無法進(jìn)行的，本次評測主要對上代的旗艦級顯示卡做了明確的性能比對。

基于DLSS3游戲用途的玩家是非常值得升級RTX 4090的，而對于普通DLSS游戲用戶而言，需求沒有那么強(qiáng)烈，生產(chǎn)力環(huán)節(jié)諸如Adobe AR PR類的軟件而言，升級理由并不充分，而對于達(dá)芬奇用戶來說就非常值得升級，深度學(xué)習(xí)方面是絕對值得升級的，但是周邊支持的完善可能需要點(diǎn)時間。

截至發(fā)文，RTX 4090的價(jià)格從首發(fā)12999奔著16000去了，京東缺貨，天貓缺貨，倒不是商家囤貨居奇，是因?yàn)?成的大廠訂單都直送美國了，這就造成中國目前的缺貨真空期，自然水漲船高。

至于PNY這張RTX 4090顯示卡，性能中規(guī)中矩，因?yàn)镸aximum Power Limit 被鎖定在450W，所以在不能動電壓的情況下超頻所獲得性能有限在2-3%附近，其長度適中且不浮夸的散熱規(guī)模令人印象深刻，因?yàn)槟鼙ＷC兼容適配大多數(shù)的普通機(jī)箱，同時性能也足夠壓制450W TDP，49%的自動風(fēng)扇控制可以最大程度保證滿載運(yùn)行時候的靜音效果，如果不破解Maximum Power Limit 其實(shí)也用不到100%的手動風(fēng)扇設(shè)置。VelocityX軟件的使用理念比較簡約，簡單暴力比較適合快速上手，ARGB的光效加持也起到了畫龍點(diǎn)睛的效果。

那么問題來了，這張卡的潛在客戶群體在哪里？這張卡適合對穩(wěn)定度有一定要求，且對機(jī)箱電源的兼容適配要求比較高的用戶，換句話說，在不想更換更高功率電源和更大規(guī)模機(jī)箱的前提下，客戶有一個850W的電源，一個普通ATX的機(jī)箱，如果你要塞進(jìn)去RTX 4090，除了NVIDIA創(chuàng)始者版本，PNY RTX 4090 OC XLR8 Gaming Verto就是最佳的選擇了。當(dāng)然前提是你需要有一個適合RTX 4090的電源以及彎折不會燒毀的12VHPWR線材。

作者聲明本文無利益相關(guān)，歡迎值友理性交流，和諧討論～

???展開全文

上一篇：游戲顯卡驅(qū)動下一篇：顯卡金手指

相關(guān)文章

熱門文檔

天天操夜夜爱_天天插天天操天天干_黄色av地址_成人黄色在线观看_国内久久久久久_欧美国产日韩一区二区三区_国产精品久久久久久久久晋中

2020顯卡

前言

開箱

拆解

測試平臺

基本情況

對比測試

DLSS3 測試

DLSS3 測試-Cyberpunk 2077

DLSS對比測試

DLSS對比測試-FAR CRY 6

DLSS對比測試-Shadow of the Tomb Raider

生產(chǎn)力測試

生產(chǎn)力測試-Adobe After Effects 22.4

生產(chǎn)力測試-Adobe Premiere Pro 22.6.1

生產(chǎn)力測試-DaVinci Resolve Studio 18.0.2

深度學(xué)習(xí)

深度學(xué)習(xí)-TensorFlow ResNet50

深度學(xué)習(xí)-PyTorch Transformer

硬件兼容性

問題一

問題二

問題三

問題四

總結(jié)

2060顯卡怎么樣

2020 顯卡

2060顯卡

1050 顯卡

4090顯卡

顯卡風(fēng)扇不轉(zhuǎn)

怎么更新顯卡驅(qū)動

顯卡測試軟件

顯卡驅(qū)動安裝失敗

3060顯卡最佳頻率

電腦顯卡驅(qū)動怎么安裝

電腦顯卡自動設(shè)置方法

gta吃顯卡還是cpu