在GeForce RTX 4070 Super和GeForce RTX 4070 Ti Super首次評測後,Super的價效比越來越紮實,結束NVIDIA的GeForce RTX GPU SUPER更新只是乙個旗艦定位Super,而這個重任就落在了GeForce RTX 4080 Super身上。
從定位和引數來看,GeForce RTX 4080 Super 已經相當有能力玩了,不僅比 GeForce RTX 4080 的起價便宜 200 美元,官方起拍價 8099 元更實惠,而且在效能方面也一步到位,觸及了 AD103 的天花板。 是的,如果 GeForce RTX 4080 Super 走得更遠,它真的可以融入 RTX 4090 系列。
撇開玩笑不談,GeForce RTX 4080 Super 的價效比再次讓我們覺得 NVIDIA 投入了足夠的資金來公升級 Super 系列,這也意味著這款 GPU 在生成式 AI、DLSS 和光線追蹤遊戲以及內容創作方面擁有更強大的戰鬥力。
那麼真的是這樣嗎? 現在讓我們來介紹一下我們對 NVIDIA GeForce RTX 4080 Super Founders Edition 的首次評測。
AD103的終極演進
GeForce RTX 4080 Super 最令人印象深刻的是代號 AD103-400-A1 核心。 我們知道,AD103保留了AD102的所有主要特性,並採用了源自台積電4N定製工藝的ADA Lovelace架構,具有459億個電晶體,核心面積為379mm。
在 ADA Lovelace 架構中,GPU 包含多個 GPC(圖形處理集群),GPC 包含多個 TPC(紋理處理集群)、多個流式多處理器 (SM),然後是 CUDA 和 RT 核心、張量核心等。 每個 GPC 中包含的 TPC 數量相等,並且當 GPU 定位和區分時,GPC 和 TPC 是物理遮蔽的。
完整的AD103包含7個GPC,但每個GPC包含不同的TPC。 如下圖所示,雖然 6 個 GPC 中的每乙個都有 6 個 TPC,但也有 1 個 GPC 只有 4 個 TPC。 例如,在 RTX 40 系列發布時,GeForce RTX 4080 是通過遮蔽 1 組 TPC 來實現的。
有趣的是,同樣使用AD103的GeForce RTX 4080 Super顯然不會在核心配置上做出任何讓步,僅從核心代號AD103-400-A1就知道,這款GPU並不簡單。 是的,GeForce RTX 4080 Super 是完整的 AD103,具有 10,240 個 CUDA 核心、80 個 RT 核心、320 個 Tensor 核心、320 個紋理單元和 112 個 ROPS。 在記憶體子系統上,總共有 10,240KB 的 L1 快取、20,480KB 的暫存器堆和 65,536KB 的 L2 快取。
不過需要注意的是,相較於專業GPU的3個第8代NVENC和3個第5代NVDEC配置,GeForce RTX 4080 Super Encoder配置了2個第8代NVENC和1個第5代NVDEC有所作為,這是消費級GPU的常見操作,對遊戲效能和AI加速效能影響不大。
不僅如此,GeForce RTX 4080 Super 的提公升頻率也為 255GHz,搭配256位16GB GDDR6X,視訊記憶體頻寬達到736GB S,TGP仍與RTX 4080相同,為320W。 另外值得一提的是未經審查的 64MB L2 快取,比 GeForce RTX 3080 的 5MB L2 快取多 12%8 倍,這使得這在遊戲中成為光線追蹤的巨大優勢,尤其是路徑追蹤。 第三代 RT Core 和 **Tensor Core 可以更好地發揮 L2 快取的效果。
至此,CES2024發布的三款GeForce RTX Super已經發布,這裡我們不妨用RTX 4080進行對比,大致規格如下。
黑色盔甲
SUPER版Founders Edition最大的不同是,用於加固的黑色中框變成了深黑色,突然看起來先進了許多。 不過整體設計思路變化不大,主要依靠錯位風扇和異形PCB的對稱設計來改善GPU的散熱。
在選材方面,GeForce RTX 4080 Super Founders Edition採用一體成型,散熱鰭片採用99%鋁合金,兼具重量輕、剛性可靠、導熱性好等特點。 同時,散熱鰭片再次加厚,變成三槽設計,擋板末端的支架孔隱藏在磁性擋板下方,只需乙個指甲即可撬開,恢復後只需將貼片放回原處,磁力就會自動吸附。
在風扇選擇方面,GeForce RTX 40 系列 Founders Edition 基本上將風扇葉片直徑提公升至 116mm,每分鐘產生的氣流足以填充 35個籃球。 此外,風扇葉片由增強玻璃纖維製成,具有彈性,可與動態軸承一起使用,以獲得更好的靜音性。
風扇下採用6根帶散熱鰭片的熱管設計,電源繼續採用最新的16pin(12vhpwr)介面,機器採用3x8pin轉接線包裝配送,TGP為320W。
在實際遊戲測試中,GeForce RTX 4080 Super Founders Edition的效能特別高,在4K遊戲環境中的功耗通常保持在250W以下。
介面設計包括三個 DisplayPort 14A 和 1 x HDMI 21 個介面。
在壓力測試中,GeForce RTX 4080 Super Founders Edition 的 GPU 溫度和表面溫度並不高。 比如GPU溫度只有58,紅外檢測可以看到整個機箱處於相當涼爽的狀態。
啟用超級戰鬥力
現在讓我們進行測試,其中包括酷睿i9-14900K,ROG Maximus Z790 Dark Hero和G技能 Trident Z5 DDR5-7200 16GBX2 支援 1250W 電源。
在基本效能測試中,主要參考是 3DMark Time SPY、3DMark Time Spy Extreme、3DMark Fire Strike Extreme、3DMark Fire Strike Ultra 和 Port Royal,它們衡量 DirectX 11 和 DirectX 12 的效能。 可以看到,GeForce RTX 4080 Super 比 RTX 4070 Ti Super 好 20% 左右,如果與上一代 RTX 3080 相比,增幅高達 70%。
因此,如果您使用的是 DLSS 2 及更早版本的常規遊戲,GeForce RTX 4080 Super 的起始解像度為 4K 最大畫質,比 RTX 3080 Ti 快 80%。 與GeForce RTX 2080 Super相比,GeForce RTX 4080 Super的改進相當誇張,範圍從150%到250%。
DLSS 3 和 DLSS 3 引入 GeForce RTX 40 系列5 技術最為重要,由於 Tensor Core 效能的巨大提公升,輔以光流加速器(OFA)和DLSS的結合,構建了更加立體化的分析方法,使GPU的實際執行過程被壓縮到原來的1 8。
dlss 3.5是一套基於AI的演算法,可以同時提高影象質量和幀率,包括DLSS幀生成(FG)和光線重建(RR)技術,加上超解像度(Super Resolution)、DLAA、幀生成(Frame generation)等技術整合。
如果用RTX 3090作為對比,你會發現,即使有24GB視訊記憶體的加持,RTX 3090在畫面流暢度方面,無論是4K還是8K解像度,都弱於GeForce RTX 4080 Super。
在 DLSS 3 及更高版本的遊戲中,GeForce RTX 4080 Super 證明了其戰鬥力。 在這裡,我們直接開啟4K最高畫質,開啟光線追蹤或路徑追蹤。 如您所見,GeForce RTX 4080 Super 與 RTX 3080 Ti 相比最多可以提公升 60% 到 200% 以上,而與 RTX 2080 Super 相比,最大提公升在 800% 以上,當然是因為 GPU 無法推動它,而且從總體結果來看,GeForce RTX 4080 Super 比 RTX 2080 Super 提公升 300% 不是問題。
即使是 DLSS 3 和 Reflex 的融合,GeForce RTX 4080 Super 在競技遊戲中也更加令人印象深刻。 特別是在 1080p 解像度下,《無畏契約》和《反恐精英 2》等遊戲的幀率達到了 300 fps 以上,系統延遲通過反射降低到 10 毫秒以下。
這裡我們使用 DLSS 3《賽博朋克 2077》的 5 個畫質對比,可以在 DLSS 3 中看到5 借助光重建,溼反射變得清晰自然,物體邊緣在暗影中依然呈現出光反射的效果,這主要是在獲得更高幀率的前提下實現的。
人工智慧和創造非常有能力戰鬥
接下來是 AI 測試環節。 GeForce RTX 4080 Super (配備 16GB GDDR6X) 是生成式 AI 向前邁出的一大步。 這裡我們不妨以 Stable Diffusion XL 為參考,Stable Diffusion XL 本身需要依靠 Transformer transformer 和卷積神經網路來執行,兩者都需要 GPU 進行大規模平行計算,這無疑是 NVIDIA 最擅長的。 正因為如此,近年來AI的快速發展很大程度上是由NVIDIA GPU技術的發展推動的。
這裡選擇的 Stable Diffusion XL 是相當穩定的 Diffusion 15 是 3 倍大,導致要計算的資料量更高,而且影象質量也更好。 這是用 Stable Diffusion Web UI + TensorRT 配置的,用更短的語言描述生成 10 張解像度為 768x768 的星際航行影象**,每次操作 1 張**,即總共 10 次執行,取樣步驟數設定為 50 步。
文字描述為:水星球上空的史詩般的太空戰,許多飛船,電影照明,景深,超細節,精美的顏色編碼,8K,許多細節,明暗對比照明。 通過記錄時間,計算出每分鐘的估計效率,參考公式為60(總時間(batchsize * batchcount))=每分鐘影象數。
GeForce RTX 4080 Super 的效能輕鬆勝過許多參與最近評測的 GPU,即使與相同視訊記憶體的 RTX 4070 Ti Super 相比,它的效能提公升也提公升了 25% 以上,這是乙個相當顯著的提公升。 這意味著 GeForce RTX 4080 Super 已經可以用於本地 AI 部署,無論是現在的文盛圖加速、圖生成,甚至是**生成,還是大型語言模型加速,GeForce RTX 4080 Super 都提供了非常豐富的算力基礎。
同時,國產軟體D5渲染器對DLSS 3也有不錯的影響5 AI加速提供支援。 由於 DLSS 35 它使用比 DLSS 3 多 5 倍的資料進行訓練,因此它還可以更好地識別光線追蹤效果,並對時空資料做出更合理的判斷,從而實現高效縮放。
在真實世界測試的極簡別墅 1 場景中,GeForce RTX 4080 Super 讓 D5 渲染器執行得極其流暢,輕鬆超過了 60 fps 的流暢度,比一周前的 RTX 4070 Ti Super 提公升了 35% 以上。
不僅如此,DLSS 35的加入也使場景發生了質的變化。 當 DLSS 35.關閉後,地面上的反射變得非常粗糙,左側的玻璃也失去了折射效果和透明度,幀率降低到原來的一半以下。
最後的 AI 測試是使用 On1 Resize AI 2022 來提高 ** 解像度。 可以看出,GeForce RTX 4080 Super 在最短的時間內完成了解像度提公升,比 RTX 3080 縮短了一半。
大量的 Cuda Core 和 RT Core 也是 GeForce RTX 4080 Super 的強項。 在 V-Ray 5 基準測試中,Cuda Core 和 RTX 是分開測試的,在 Cuda Core 較多的情況下,GeForce RTX 4080 Super 在 CUDA 效能和光線追蹤方面都有很強的表現,比 RTX 3080 好 60%。
另一款 Octane Render RTX 用於測試 GPU 的光線追蹤效能,測試 GPU 在複雜場景中生成的取樣率,GeForce RTX 4080 Super 比 RTX 3080 好 50%。
此外,在 Blender 基準測試引入的三個參考場景中,GeForce RTX 4080 Super 比 RTX 3080 高出 80%。
在專業軟體建立環節中,我們引用了 SpecViewPerf 2020,這是對在 OpenGL 和 Direct X API 下執行的系統的 3D 圖形效能的特殊測試,包括 3DSMAX、Catia、Creo、Energy、Maya、Medical、SNX 和 SolidWorks。 與 RTX 3080 相比,GeForce RTX 4080 Super 的幀速率提高了 50% 至近 90%,適用於專業應用。
寫在最後:定義超上限
GeForce RTX 4080 SUPER 的一大優點是,它以比 RTX 4080 更便宜的定價策略實現了目前的 Super Ceiling,完整的 AD103 GPU 沒有讓人失望,RTX 4080 的戰鬥功耗沒有提公升,4K 解像度下的 DLSS 3 遊戲表現令人驚嘆。
事實上,GeForce RTX 4080 Super 已經是一款可以充滿特效的 GPU,在 4K 解像度暢執行所有傑作,你所要做的就是進入遊戲,遊戲的檢測系統會自動調整最高配置,或者手動將畫質滑塊拉到頭上,體驗玩遊戲永遠不看畫質設定的人生巔峰,此時8099元的定價將特別划算。
在遊戲之外,GeForce RTX 4080 Super 已經證明自己是乙個多面手,無論是通過 Stable Diffusion XL 還是 DLSS 3 加速生成式 AI5 個加速 D5 渲染器,或海量 CUDA 核心,用於加速 3DSMAX 和 CATIA 等專業軟體,或替換為 NVIDIA Studio 驅動程式以訪問 NVIDIA Omniverse 元宇宙。
GeForce RTX 4080 Super 是一款可以輕鬆變成全能型 PC 的 PC,因此即使您是專業的美術師、設計師或遊戲開發人員,也可以加速這款 GPU 或專業應用程式的快感。 特別是搭載16GB GDDR6X超大視訊記憶體的GeForce RTX 4080 Super出色的AI效能,讓使用者無需再為AI服務付費,依託GeForce RTX 4080 Super的本地AI效能,輕鬆實現文生圖、**代、大語言模型加速,為即將到來的本地化AI時代提供了充足的計算基礎。
而這款代表當下Super系列最高上限的產品,也很好地詮釋了價效比。 如果您想獲得充足的 AI 效能並以最高質量執行 4K 的 3A 遊戲,並且想要輕鬆使用**、圖形或專業軟體,那麼 GeForce RTX 4080 Super 是適合您的 GPU。