在今年的 CES 2024 上,NVIDIA 通過 GeForce RTX 40 系列 Super 顯示卡進一步完善了 RTX 40 系列顯示卡系列。 今天,GeForce RTX 40 系列的第九款顯示卡 NVIDIA GeForce RTX 4080 Super 正式到貨。
全新 GeForce RTX 4080 Super GPU 為遊戲、創作和工作提供革命性的 AI 效能,並通過基於 RTX GPU 構建的豐富軟體加速庫進行了增強。
這一次,我們將為大家帶來技嘉RTX 4080 Super Gaming OC Magic Eagle 16G顯示卡的效能測試,讓我們看看這款RTX 4080 Super顯示卡在外觀、做工、散熱等方面的表現如何,並實際測試RTX 4080 Super在AI圖形、3D渲染等方面的表現,以及遊戲效能與RTX 4080和上一代RTX 3090 Ti相比有多領先, 以及 RTX 領先多遠 4090 的效能差距有多大。
技嘉 RTX 4080 Super Gaming OC 16G 規格 技嘉 RTX 4080 Super Gaming OC 16G 顯示卡擁有 10240 流處理器,112 光柵處理單元,320 紋理單元,64MB 二級快取,顯示卡核心頻率為 2295-2595MHz,電源輸入介面為 16PIN (12+4)。 它使用 16GB GDDR6X 視訊記憶體,記憶體位寬為 256 位,記憶體頻寬為 736相當於 23Gbps 時為 3Gbs。
規格方面,與RTX 4080顯示卡相比,RTX 4080 Super顯示卡的CUDA核心數從滿規格的9728個增加到10240個,增加了5個。 基頻和加速度頻率分別提高了90MHz和50MHz,而TGP保持不變。
AD103-400 GPRTX 4080 Super採用完整的AD103 GPU核心,採用台積電4N工藝,核心面積為379mm2,電晶體數為459億個。 共有 7 個 GPC,其中 6 個 GPC 包含 6 個 TPC,1 個 GPC 包含 4 個 TPC,每個 TPC 有兩組 SM,總共 80 組 SM,即 10240 個 CUDA。
淺析RTX 40系列超級顯示卡的優勢
如果說 NVIDIA GeForce RTX 40 系列 GPU 有哪些最令人驚嘆的技術之一,那就是 DLSS 3。
DLSS 3 幀生成 (DLSS 3 Frame Generation) 由 GeForce RTX 40 系列 GPU 上的全新 Tensor Core 和光流加速器提供支援,在 DLSS 2 超解像度技術中新增了 AI 驅動的幀生成功能,可建立更多幀並提高影象質量,使遊戲更加逼真並顯著提高幀速率。
NVIDIA 於 2023 年 8 月底正式發布 DLSS 35. 該技術新增了光線重建(RR),其主要功能是用在NVIDIA超級計算機上訓練的AI網路取代人工設計的降噪效果,從而在取樣的光線之間產生更高質量的畫素,從而顯著提公升所有GeForce RTX GPU的光線追蹤影象質量。
在現實世界的遊戲中,開啟光重建的光照更準確,遊戲更清晰、更細膩、重影更少,並且在光照條件發生巨大變化時反應更靈敏。
GeForce RTX 40 系列 GPU 基於 ADA 架構構建,可釋放光線追蹤的強大功能,模擬真實世界的光線行為。 借助 GeForce RTX 40 系列 GPU 和第 3 代 RT Core 的強大功能,遊戲玩家可以在虛擬世界中體驗前所未有的精彩細節。
迄今為止,已有 500 多款遊戲和應用支援 NVIDIA RTX 技術,NVIDIA 正式啟動了 RTX 500 活動,以慶祝這一里程碑。
除了遊戲之外,GeForce RTX 40 系列 GPU 在 AI 方面也有非常強的表現,擁有專用的 AI Tensor 核心、非常受創作者歡迎的 Studio Clipping、將簡單線條變成逼真風景的 NVIDIA Canvas、NVIDIA Broadcast、Stable Diffusion,以及光線追蹤 3D 渲染器 D5 渲染器 Render 等軟體可以為使用者提供強大的效能和創新功能, 使提高他們的創造能力和提高工作效率變得容易。
技嘉RTX 4080 SUPER Magic Eagle顯示卡外觀 (1).
本次測測採用技嘉RTX 4080 Super Gaming OC 16G顯示卡,是技嘉的中高階顯示卡系列,在效能、散熱、外觀和價格之間取得了很好的平衡。
技嘉 RTX 4080 Super Gaming OC 16G 顯示卡配件基本上是必備的 16pin 轉 3*8pin 轉接線,以及定製顯示卡支架。 支架是為這款顯示卡量身定做的,讓顯示卡更加穩定和安全,同時其款式和配色方案也與顯示卡的外觀相匹配,可以輕鬆與顯示卡整合。
技嘉RTX 4080 Super Gaming OC 16G顯示卡以黑色為主,正面有磨砂外殼和多條對角線。 顯示卡尺寸為342*150*75mm,可以相容大多數情況。
顯示卡採用三風扇散熱設計,配備三個110mm導流風扇。 導流板風扇將氣流從風扇邊緣轉移,並通過葉片表面的 3D 條紋曲線平穩地引導氣流。 風扇採用奈米石墨烯潤滑油製成,在使風扇旋轉更安靜的同時,可以有效延長風扇的使用壽命。
風扇設計為正反轉,相鄰風扇沿不同方向旋轉,可有效減少湍流,增加氣壓。 顯示卡風扇支援自動停止功能,當溫度較低時,風扇將停止工作,當遊戲開始後溫度公升高時,風扇會自動恢復旋轉。 智慧型啟停不僅有效降低噪音,還增加了風扇的使用壽命,為遊戲玩家提供更好的體驗。
技嘉RTX 4080 SUPER Magic Eagle顯示卡外觀 (2).
技嘉 RTX 4080 Super Gaming OC 16G 側面配備技嘉 RGB Faith Light,中間配備 GeForce RTX 標誌。
技嘉RTX 4080 Super Gaming OC 16G配備12+4pin電源介面,電源指示燈常閃爍,當電源出現異常時提醒遊戲玩家。
顯示卡的輸出介面為標準3*dp 14a + 1*hdmi 2.1a組合。
技嘉RTX 4080 Super Gaming OC 16G採用加固金屬背板,增強了顯示卡PCB的結構強度和ESD保護。
背板後部的超大擋風玻璃允許風扇的氣流以較低的阻力穿透翅片和背板,從而實現更有效的散熱。
技嘉RTX 4080 Super Gaming OC 16G顯示卡採用雙BIOS設計,同時提供OC(效能)和Slient(靜音)模式,可在顯示卡背面進行調整,預設為超頻模式。
技嘉RTX 4080 SUPER Magic Eagle燈光效果
顯示卡採用RGB光輪,支援1680萬種顏色調節和多種燈光效果切換,可通過技嘉智慧型管理器進行定製。
技嘉 RTX 4080 Super Gaming OC 16G 顯示卡點亮實景。
技嘉 RTX 4080 Super Gaming OC 16G 顯示卡點亮實景。
技嘉 RTX 4080 Super Gaming OC 16G 顯示卡點亮實景。
技嘉 RTX 4080 Super Gaming OC 16G 顯示卡點亮實景。 技嘉RTX 4080 Super Magic Eagle顯示卡拆解
技嘉RTX 4080 Super Gaming OC 16G PCB板比散熱片模組更短,搭配開孔背板和三風扇設計,顯示卡可以快速散熱,最大限度發揮顯示卡效能。
技嘉RTX 4080 Super Gaming OC 16G顯示卡在PCB正面覆蓋有導熱墊,可以快速將記憶體和電源元件的溫度傳遞到散熱模組,加速顯示卡內部產生的熱量。
RTX 4080 Super使用的AD103-400-A1核心。
技嘉RTX 4080 Super Gaming OC 16G顯示卡採用16+3相供電設計,顯示卡各MOSFET均設計有過溫保護,確保顯示卡能夠持續穩定工作,保證顯示卡效能。
在記憶體部分,美光的 8 個 GDDR6X 記憶體晶元圍繞 GPU 核心排列,每個晶元的容量為 2GB,總共 16GB 視訊記憶體。 記憶體位寬為256位,記憶體頻寬為7363gb/s。
技嘉RTX 4080 Super Gaming OC 16G採用風力散熱系統,帶有三個110mm導流風扇,乙個接觸GPU的銅底座,九根復合熱管,以及乙個進氣格柵,使顯示卡能夠快速從GPU的核心傳遞熱量,使顯示卡具有更快的傳熱,更低的噪音, 以及更強大的散熱。
通過拆解可以發現,技嘉RTX 4080超級遊戲OC魔鷹16G顯示卡在電源和散熱方面有很多用料,為顯示卡的全力發揮奠定了良好的基礎。
測試平台及測試方法介紹
測試台一目了然。
測試專案清單技嘉智慧型管理器(GCC)。
技嘉控制中心(GCC) 首頁技嘉控制中心(GCC)是所有技嘉產品的統一軟體,介面直觀,體驗豐富。 該軟體允許您實時調整顯示卡的頻率、電壓、風扇模式、RGB 燈效和功耗,讓遊戲玩家輕鬆控制顯示卡的狀態。
技嘉控制中心(GCC)RGB燈光調節介面。
技嘉控制中心(GCC)風扇控制介面。
技嘉控制中心(GCC)效能調優介面3DMark 基準測試
3DMark Fire Strike 測試。
3DMark Fire Strike Extreme 測試。
3DMark Fire Strike Ultra 測試。
3DMark Time Spy 測試。
3DMark Time Spy Extreme 測試3DMark 光線追蹤、DLSS 測試
3DMark Port Royal 測試。
3DMark DirectX 光線追蹤功能測試 NVIDIA GeForce RTX 40 系列顯示卡的一大變化是增加了 DLSS3 技術,DLSS3 基於上一代 DLSS,通過光流加速推斷下一幀生成的目標影象,大大節省了傳統的 CUDA 算力,讓 GPU 在處理高解像度實時渲染遊戲時更加得心應手, 與不使用DLSS相比,理論上遊戲效能最多可以提公升4倍。從理論上講,DLSS3 的效能是 DLSS2 的兩倍,這要歸功於幀生成功能,它允許 GeForce RTX 40 系列顯示卡以高解像度和高質量執行所有支援 DLSS3 的遊戲,同時壓力更小。
3DMark DLSSS3 功能測試。
3DMark DLSSS2 功能測試在 3D Mark DLSS 測試類別中,結果在 4K 解像度下非常相似,但在啟用 DLSS(效能)的情況下,技嘉 RTX 4080 Super Gaming OC 16G 顯示卡可以在 4K 下將 DLSS3 效能提公升 235%,遠遠超過 DLSS2 159% 的提公升。
dlss 3.5款遊戲《2077》、《喚醒殺手2》測試
由於 RTX 40 系列顯示卡最有價值的優勢是增加了對 DLSS3 的支援,因此我們選擇了 6 款支援 DLSS3 進行遊戲測試,其中兩款還支援最新的 DLSS 35款遊戲大作進行遊戲效能對比測試。
我們來測試一下DLSS開啟和關閉DLSS的DLSS3(RTX 40系列)和DLSS2(RTX 30系列)的遊戲效能,看看RTX 4080 Super顯示卡能領先RTX 4080顯示卡多少,與RTX 4090顯示卡有多大區別,DLSS3的RTX 4080 Super能領先多少DLSS2的RTX 3090 Ti。
《賽博朋克 2077》在 4K 解像度下的表現比較。
《賽博朋克 2077》在 2K 解像度下的效能比較。
4K解像度《艾倫威克2》遊戲效能對比。
2K解像度《艾倫覺醒殺手2》遊戲效能對比《消逝的光芒2》、《F1 22》遊戲測試
消逝的光芒 2 4K 解像度的遊戲效能比較。
《消逝的光芒 2》在 2K 解像度下的遊戲效能比較。
4K 解像度 F1 的效能比較 22.
2K 解像度 F1 22 遊戲的效能比較《光明記憶》和《瘟疫傳說》遊戲測試
4K解像度“Bright Memory:Infinite”遊戲的效能比較。
2K解像度“Bright Memory: Infinite”遊戲的效能比較。
4K解像度《瘟疫傳說:安魂曲》的效能比較。
《瘟疫傳說:安魂曲》在2K解像度下的效能比較遊戲測試摘要:
通過測試,我們可以發現,與RTX 4080相比,技嘉RTX 4080 Super Gaming OC 16G顯示卡有224%的效能優勢,建議零售價比RTX 4080低1400元,確實增量降價。
相較於上一代旗艦級RTX 3090 Ti顯示卡,技嘉RTX 4080超級遊戲OC Magic Eagle 16G顯示卡具有顯著的遊戲效能優勢,整體效能優勢高達43%,其中,啟用DLSS3時實際遊戲幀率提公升高達55%,即使不啟用DLSS,效能也提公升25%。
與當代旗艦RTX 4090相比,技嘉RTX 4080 Super Gaming OC 16G顯示卡仍有一定差距,實際遊戲效能低了22%。
在實際遊戲體驗方面,技嘉RTX 4080 Super Gaming OC 16G顯示卡效能輕鬆,是唯一一款全光線追蹤支援的高品質遊戲,《賽博朋克2077》和《艾倫威克2》,這是唯一支援全景光線追蹤的優質遊戲,開啟DLSS3時也能保證平均遊戲速率60+ FPS, 為遊戲玩家帶來流暢的遊戲體驗。
AI 對映 – 穩定擴散測試
除了遊戲效能外,GeForce RTX 40 系列 GPU 正在成為創作者的首選工具,而 AI 則是生產力的倍增器。
Stable Diffusion 是一種流行的 AI 繪畫生成工具,可讓您通過輸入句子或特定關鍵字輕鬆生成所需的影象。 基於AI計算,軟體可廣泛應用於平面和3D設計,並借助擴散模型生成大量**,大大縮短了繪圖時間,效率顯著提高。 該軟體由 NVIDIA RTX GPU 加速,記憶體容量越高,它可以支援的影象解像度越高,GPU 級別越高,渲染速度越快。
Stable Diffusion 是一款 AI 繪圖工具,支援 NVIDIA 的高效能深度學習推理 SDK TensorRT,可優化推理效能、加速各種工作負載並支援大型語言模型推理。
參考相關外掛程式後,可以將“Tensorrt”標籤新增到 Stable Diffusion 中,然後通過一系列設定,通過 Tensorrt 加速 AI 繪畫。
本次測試中使用的顯示卡為:
技嘉 RTX 4080 Super Gaming OC 16G
nvidia geforce rtx 3090 ti
測試模型為 SD XL Base 10_0.9vae.safetensors
測試中選擇的抽樣方式為EULAR A,取樣步數為50步,**的寬高為1024 1024,提示詞相關係數為7,總批數為10,單批數為1,隨機數種子為13(確保可以生成相同的影象)。
穩定擴散常規圖紙 (RTX 3090 Ti) 共 173 張3 秒,平均 346 影象。
穩定擴散常規圖紙(RTX 4080 Super),共136張8 秒,平均每分鐘 4 秒4 張圖片。
TensorRT 加速穩定擴散繪圖 (RTX 4080 Super) 共 63 個5 秒,平均 9對 5 張影象的比較表明,當使用相同的 SD XL 進行穩定擴散常規繪圖時,RTX 4080 Super 顯示卡的效能比 RTX 3090 Ti 高出 27%。 加入支援 RTX 4080 Super 的 TensorRT 加速後,RTX 4080 Super 顯示卡的 AI 繪圖效率大幅提公升,比 RTX 3090 Ti 提公升了 175%,甚至與未開啟 TensorRT 加速的 RTX 4080 Super 顯示卡本身相比,開啟 TensorRT 加速後效率也提公升了 116%, 這可以為使用者提供更快的 AI 生成體驗。
3D 光線追蹤渲染器 - D5 渲染測試
D5 Render 是一款免費的實時光線追蹤渲染器,適用於從事大型建築或景觀專案的 3D 設計師和專業人士。 憑藉先進的實時光線追蹤、D5 Gi 全域性照明解決方案和大量現成的資產,D5 Render 可以在更短的時間內以高真實感完成專案。
在最新一代的 D5 渲染 (D5 Render) 中,新增了專為逼真的光線追蹤視覺效果而開發的 NVIDIA DLSS 35. 整合包括 DLSS 超解像度、幀生成和由 AI 神經網路提供支援的光線重建。
其中,光線重建是一種全新的神經渲染AI模型,通過為各種內容提供快速、智慧型的去噪解決方案,可以進一步提公升光線追蹤的視覺質量。 NVIDIA DLSS 幀生成功能可增強光線追蹤效能並提高實時視口幀速率,從而為直觀的互動式 3D 創作提供更流暢的編輯體驗。
這一次,我們用技嘉 RTX 4080 Super Gaming OC 16G 和 NVIDIA GeForce RTX 3090 Ti 顯示卡對其進行了測試,看看最新新增的 DLSS 35 D5 渲染渲染的增加。
使用 DLSS3 進行 D5 渲染測試 (RTX 4080 Super)超解像度取樣+光線重建+5中實時高幀率,平均幀率97fps
D5 渲染測試 (RTX 4080 Super),DLSS3超解像度取樣+光線重建+5中實時高幀率,平均幀率34fps
使用 DLSS3 進行 D5 渲染測試 (RTX 3090 Ti)超解像度取樣+光線重建合五,平均幀率44fps
使用 DLSS3 進行 D5 渲染測試 (RTX 3090 Ti)超解像度取樣+光線重建+實時高幀率在5中,平均幀率20FPS,可以看到DLSS 4080是用RTX 3 Super顯示卡開啟的在 5 中的所有選項之後,使用 D5 渲染渲染場景可以將效能提高多達 2 倍。 與 RTX 3090 Ti 顯示卡相比,RTX 4080 Super 開啟了 DLSS 35 在可以開啟時具有 120% 的效能優勢。 在同樣接近的 DLSS 3在5種選擇的前提下,RTX 4080 Super也比RTX 3090 Ti有70%的效能優勢,可以給使用者帶來更流暢的創作體驗。
Web**使用者優勢 – RTX VSR 技術
相信大家在觀看**的時候,經常會遇到由於畫面清晰度低而難以獲得滿意的觀看體驗的情況。 以前,遇到這種情況的使用者是無奈的。 然而,隨著 RTX VSR 的出現,這些問題已經得到解決——使用 GeForce RTX 40 和 RTX 30 系列顯示卡的使用者可以使用 RTX VSR 技術來實時增強觀看體驗。
RTX VSR的全稱是RTX Video Super Resolution,它利用RTX GPU中的Tensor核心進行AI計算,從每個瀏覽器的**壓縮演算法中去除塊狀壓縮偽影,從而達到提高解像度和清晰度的目的。 此功能目前支援谷歌Chrome和Microsoft Edge等主流瀏覽器(公升級到最新版本),此外,技嘉RTX 4080超級遊戲OC Magic Eagle 16G具有雙編解碼器,並且還為**1增加了硬體編碼功能,無論您是在B站,鬥魚還是其他平台***,它都使**質量值得您匹配4K顯示。
VSR 的功能開關整合在 NVIDIA 控制面板中,可以在“調整下拉欄”影象設定 - RTX 增強功能的介面中看到。 勾選此選項並點選應用,即可開啟RTX VSR,並且還支援優化級別的設定,預設為1,最大為4。
通過逐步增加 VSR 演算法的複雜度,可以優化高達 360p 到 1440p 的視覺效果,並且 GPU 使用率也會增加,這與 VSR 的質量水平成正比。 Level 1 和 Level 2 的 GPU 使用率較小,質量有了明顯的提公升,對低端 GPU 也非常友好。
*分界線左側為原**畫面,右側為開啟RTX VSR的畫面,顯示清晰度明顯增強,幾乎接近渲染CG的效果。
我們在網路上看到的大部分內容都被重新編碼和壓縮,從而降低了容量並損失了一些質量。 以前銳化的處理過程在提高清晰度的同時往往會失真,而 RTX VSR 通過將 NVIDIA Tensor Core 與最先進的 AL 影象處理相結合,智慧型地銳化和銳化特徵和邊緣,同時消除煩人的壓縮偽影,以提供與標記的原始解像度相當的影象質量。
熱測試及結論
技嘉RTX 4080 Super Gaming OC 16G風扇支援空閒空閒功能,可大大降低顯示卡在低負載執行時的噪音,增加風扇的使用壽命。
技嘉RTX 4080 Super Gaming OC 16G顯示卡在室溫26°C和GPU溫度40°C待機20分鐘後,均能提供出色的散熱效能5、風機處於靜止狀態。
技嘉RTX 4080 Super Gaming OC 16G顯示卡散熱測試我們用Furmark烤箱來測試顯示卡的散熱效能,觀察顯示卡溫度穩定一段時間後,觀察顯示卡的最終溫度。
烘烤時間約20分鐘,顯示卡核心溫度636.記憶體溫度為52,GPU使用率為100%,當前功耗為3184w。風扇負載為53%,轉速為1883rpm。 技嘉RTX 4080 Super Gaming OC 16G顯示卡在散熱方面非常出色。
結論
作為NVIDIA GeForce RTX 40 Super系列的第三款顯示卡,RTX 4080 Super顯示卡的整體效能不錯,在價格低於之前RTX 4080 1400元的基礎上,CUDA核心提公升了5%,核心頻率、視訊記憶體頻寬和等效頻率都有一定程度的提公升, 而且金額確實增加了,價格也降低了。
在遊戲效能方面,RTX 4080 Super 顯示卡在遊戲效能上可以以較低的價格略微超越 RTX 4080,在最高解像度的 4K 遊戲中可以達到 60+ FPS 的平均遊戲幀率,可以為遊戲玩家帶來流暢的 4K 遊戲體驗。
在AI方面,NVIDIA專用的AI Tensor核心,結合Stable Diffusion和D5 Render等軟體,可以為使用者帶來更高的效能和效率,給使用者更流暢的創作體驗。
本評測中的技嘉RTX 4080 Super Gaming OC 16G顯示卡,外觀低調內斂,又不失個性。
顯示卡採用堅固材料,16+3高規格電源設計,散熱模組面積擴大,配上強大的風電散熱系統,讓GPU可以長時間保持最佳工作狀態,為顯示卡的持續高效能輸出提供了絕佳的空間。 顯示卡擁有 4 年保修,是一款集外觀、效能、散熱於一體的顯示卡產品。
技嘉RTX 4080超級遊戲OC 16G顯示卡已在各大電商平台上線,售價8799元,適合喜歡RGB燈效環繞,對顯示卡散熱靜音要求高,專注於4K高品質遊戲大作或對AI效能有高要求的內容創作者。