自從AMD和英偉達不朽爭奪高階市場開始,2000元以下的GPU幾乎什麼都玩不了。 直到 2022 年英特爾推出英特爾銳炫顯示卡,回歸獨立顯示卡市場,基於 Xe-Core 的 GPU 誕生,XE-HPG 架構進入消費級獨立顯示卡市場,讓市場中兩人的對抗轉為三足立板。
遊戲顯示卡不是用來製造的。 這不僅需要先進的製造工藝和高效的大規模並行處理能力設計,還需要得到遊戲引擎和從業者的認可,才能在PC平台上獲得出色的相容性。 尤其是用NVIDIA CUDA Core、Tensor Core、RT Core、Game-ready Drivers構建遊戲生態的行業壁壘,就更難了。
即便如此,英特爾ARC依舊利用先進的設計理念和英特爾自身強大的行業號召力和研發能力,讓ARC得以持續公升級,也相當出色。 就拿我們今天的主角英特爾ARC A750來說,超頻版超頻版僅需1649元。 說句情理,你還想要什麼自行車。
光有**是不夠的,只有足夠的效能才配得上價效比的描述。 iCard首次亮相近一年半,在遊戲、創作、AI、驅動優化等方面取得了怎樣的進步,現在不到2000元的成本值得嗎? 現在讓我們以 Gunnir Intel ARC A750 Photon 8G OC W 為例。
鍊金術士出現
在XE-HPG中,代號為Alchemist的GPU率先登上市場舞台,按照計畫,Intel ARC品牌未來將包括Alchemist、Battlemage、Celestial和Druid。
在設計方面,XE-HPG並不是之前第13代酷睿GPU使用的XE-LP的擴充套件版本,而是有了新的設計,即引入了XE-Core核心。 Xe-Core 可以被認為是向量和張量 ALU 的集合,具有 L0 和 L1 快取單元。 邏輯上接近 XE-LP 子切片,NVIDIA SM(流式多處理器)。 如果你對GPU有所了解,你可能知道單位級別不是一成不變的,例如,NVIDIA在更新架構時修改了SM級別。
每個 XE 核心將包含 16 個向量引擎 (VE) 和 16 個 XE 矩陣擴充套件 (XMX)。 這些向量引擎中的每乙個每個週期可以處理 256 位。 如果分解,每個向量引擎包含 8 個 FP32 ALU,這與 XE-LP EU 大致相同。 由於 16 個向量引擎每個時鐘能夠處理 128 個 FP32 操作,即 256 FLOPS 的 FMA 吞吐量,因此就每個時鐘的吞吐量而言,它也與 NVIDIA Ampere GPU 相同。
在 XE-Core 中,每 16 個向量引擎與 16 個矩陣引擎配對,用於矩陣和張量計算,英特爾在這裡使用專有名詞作為其名稱,XE Matrix Extensions,縮寫為 XMX,這表明了它的重要性。 XMX 主要用於 AI 加速的矩陣張量計算,每個 XMX 引擎都使用乙個 8 深度脈動陣列。 XMX 每個時鐘週期執行 8 個 512 位寬的矩陣計算。 這些向量和矩陣引擎由乙個寬負載儲存單元支援,該單元每個時鐘週期可以檢索 512b 的資料,而每個 xe 核心都有 512kb 的 l1 資料快取。
儘管 SM 和 Xe-Core 在向量吞吐量上相當,但英特爾的矩陣運算吞吐量是其兩倍,並且可以執行兩倍於 ALU 的效能,這意味著英特爾 GPU 仍然傾向於在矩陣計算和 AI 計算上投入更多資源。
在 XE-Core 之上,XE-HPG 的邏輯是渲染切片,它與 XE-LP 一樣,為 Intel GPU 提供了大部分功能。 對於 Alchemist,乙個切片包含 4 個 xe 核心、4 個光線追蹤單元、4 個紋理取樣器、幾何光柵化前端和 2 個畫素後端。 這種 4:4:4 布局意味著在 Alchemist GPU 中,每個 XE-Core 都有自己的紋理取樣器和光線追蹤單元。
由於 Alchemist GPU 最多包含 8 個切片,因此完整的 GPU 狀態包含 32 個 Xe-Core、4096 個 FP32 ALU,支援 DirectX 12 Ultimate,並具有 XMX 矩陣引擎。 然後從此切下來,形成不同定位的獨立顯示卡產品。
英特爾 ARC A750 就是這種情況。 它使用GD2-512 GPU,代號為ACM-G10,基於台積電的6nm工藝,擁有217億個電晶體,核心面積為406公釐。 與 A770 相比,僅移除了乙個渲染瓦片單元,7 個渲染瓦片單元共有 28 個 xe 核心、28 個光線追蹤單元、448 個 xmx 引擎和 2 個基本頻率05GHz,最高頻率可達24ghz,tdp 225w。
不僅如此,作為英特爾ARC GPU的AIC廠商之一,藍戟也為A750增添了不少色彩。 作為評測,Gunnir Intel ARC A750 Photon 8G OC W 採用了更符合白色主機美學的白色外觀設計,並搭配一套名為 ICICLE 的多維散熱系統,可以更好地保證顯示卡的穩定性能。
例如,三旋翼風扇本身支援智慧型啟停技術,可以有效控制顯示卡的散熱噪音,五根鍍鎳熱管+高密度散熱片可以提供良好的散熱輔助效果。 在實際測試的壓測狀態下,可以看出GPU核心溫度高達58,顯示卡的外部溫度集中在電源部分,在20的室溫環境下溫度在45左右。
同時,Gunnir Intel ARC A750 Photon 8G OC W 電源部分採用雙 8 針設計,與 ATX 3 相容性很好0.前置電源設計。
在介面配置方面,Gunnir Intel ARC A750 Photon 8G OC W 提供足夠的 1 個 HDMI 21 和 3 DisplayPort 20,這意味著ARC A750還可以在介面上支援8K解像度輸出。
遊戲驅動持續優化
現在我們進入實戰環節,這裡的測試平台以酷睿i9-14900K、iGame Z790D5 Ultra、iGame DDR5 16GB 6800*2 Ultra W為參考,主要關注1080P最高畫質,以及3DMark基準測試。
在 3DMark 基準測試中,使用了 3DMark Time SPY、3DMark Time Spy Extreme、3DMark Fire Strike Extreme、3DMark Fire Strike Ultra 和 Port Royal 作為參考,在基本級別上略勝於 GeForce RTX 3060 12GB。
遊戲環節讓我們更進一步。 在文章的開頭,我們提到隨著時間的推移,英特爾 ARC GPU 驅動程式與遊戲的相容性越來越高。 2024 年 1 月,Arc 顯示卡驅動再次迎來重大更新,最新驅動 Game On 支援多款新遊戲,也為 20 多款熱門 DX11 和 DX12 遊戲帶來了不同的效能提公升。 這裡我們使用 310.101.4972 驅動器與最新的 310.101.對 5333 驅動器的比較表明,在短短三個月內就有了顯著改進。
在《正當防衛3》的情況下,新驅動在1080p的最高畫質下提公升了160%以上,遊戲從基本流暢變成了以超過170fps的高水平執行。 《文明6》是乙個明顯的提公升,幀率提公升了35%以上,《消逝的光芒2:人與仁之戰》也令人印象深刻,讓這款跑酷遊戲能夠以超過100fps的速度輕鬆執行。 同時,Apex也有不錯的增長。
比如在較新的《賽博朋克2077》的3A級大作中,在開啟1080p高階光線追蹤的前提下,新驅動帶來的幀率提公升已經達到了40%以上。 同時,您還可以在設定介面看到 Xess Super Sampling 可以直接啟用。
XEss Super Sampling 技術類似於火熱的 NVIDIA DLSS、AMD FSR,通過一系列 AI 優化演算法,以較低的計算資源為代價,換取更高的效能和影象質量。 與DLSS類似,它是一種結合空間和時間來改善AI影象的技術,即它使用空間資料(相鄰畫素)和時間資料(上一幀中移動物體的向量)的組合來從神經網路中學習。
事實上,英特爾在宣布ARC品牌之前已經為ARC品牌工作了很長時間,並且已經優化了數百款遊戲,使ARC A750在新舊遊戲中執行得越來越流暢。
例如,在《反恐精英 2》和《原子之心》中,您可以看到 15% 的增長,而 Hunt: Showdown 可以看到超過 35% 的提公升。
還值得一提的是,英特爾ARC驅動直觀的控制面板,不僅為遊戲組織提供了酷炫的介面,還整合了廣播、捕捉、精彩時間捕捉等多種功能。 您還可以開啟固定效能面板,以在遊戲執行時監控 GPU 的效能。
AI耀眼,創造新專家
強大的並行處理能力使得GPU本身非常適合內容創作工作,英特爾ARC A750在設計XE Core和XMX引擎時,也特意將重點放在內容創作、AI加速、**1編解碼器等方面。 舉個最直觀的例子,英特爾ARC的**1編碼和解碼能力非常強大,即使使用D**Inci Resolve對2分鐘的12GB 4K素材進行編碼,實際使用時間甚至可以比GeForce RTX 4090更快。
同時,我們也使用RTX 3060 Ti和RTX 4090來對抗H265格式輸出對比,也可以看出英特爾ARC A750真的很兇。
*1 的優點也可以直接用於遊戲串流和串流,因為 **1 編碼器比 h 更好264 效率更高,在相同的頻寬或音量下,**1 可以顯示更清晰的細節。 這裡我們用《反恐精英2》的**1和**c的現場錄音進行對比,在同一場景中,可以清楚地看到,**1流**的建築物輪廓和槍身更加清晰。
而在Procyon基準測試中,我們也可以看到英特爾ARC A750在處理和處理方面的綜合表現,相當不錯。
在 Blender Benchmark 渲染輸出中,主要檢測了 Moser、Junkshop 和 Classroom 三個輸出場景,效能如下,與 RTX 3060 不相上下。
2020年工程專業通用Specviewperf。 這是能源勘探、醫學、建築設計、機械設計、汽車設計、飛機設計等領域的專業軟體圖形測試,包括3dsmax、catia、creo、energy、maya、medical、snx、solidworks等主流軟體。 英特爾 ARC A750 已經在大多數專業軟體中流暢執行。
最後,英特爾ARC A750也具有良好的AI效能。 這裡我們以穩定擴散為例。 Stable Diffusion 是 2022 年推出的一款用於深度學習文字到影象轉換的 AICG 工具,由初創公司 Stability AI 與非營利組織和學術人員合作開發,因此比需要付費的 Midjourney 更加開放和可擴充套件,並提供一系列外掛程式來實現更多功能,例如 AI** 修復、 文字提示引導影象,甚至影象翻譯等。可以預見,未來將繼續採用更強大的功能。
穩定擴散的前提是至少需要 8GB 的 VRAM 和具有強大 AI 效能的 GPU,否則本地體驗不如購買雲服務那麼簡單。 通過直接獲取B站的一鍵執行資源,英特爾ARC A750可以通過中文介面輕鬆執行穩定的擴散,即使對於新手玩家來說,配置也不再是問題。
在這裡,我們使用固定的文字描述來指導 Stable Diffusion 建立 20 個與描述相匹配的建築景觀**。 在UI介面設定ARC A750一次計算2張**,總共執行10次,即20張。 每張**片的解像度為512x512解像度,取樣步數設定為50,取樣方式選擇為Euler A。
文字說明如下:
beautiful render of a tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, depth of field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, +dreamlike, vignette
在實際使用中可以看出,ARC A750輸出**的效率和質量都不錯,完成20**的生成僅需2分14秒,平均67秒生成乙個**,根據每分鐘影象的演算法,公式為60(總時間(batchsize*batchcount))=每分鐘影象數,最終生成效率為8每分鐘95張圖片@512x512是乙個非常好的表現,尤其是作為GPU的價格在1649元,表現非常出色。
寫在最後:乙個高價效比的創意工具
英特爾 ARC A750 的優勢在於其強大的多處理能力,尤其是強大的 **1 編解碼能力,即使與旗艦 GeForce RTX 4090 相比也是如此。 而隨著英特爾驅動的持續優化,玩家的遊戲體驗與日俱增,英特爾ARC A750在主流遊戲中的表現也越來越成熟,部分遊戲場景更新遊戲驅動後可以得到2倍以上的效能提公升,在目前1649元的定位下, 真的讓人覺得自己賺了很多錢。
如果你想讓AI效能更上一層樓,我還建議考慮配備16GB視訊記憶體的Intel ARC A770,這不僅價效比高,而且在AI效能上更令人印象深刻,視訊記憶體更大。
總之,我們從英特爾ARC A750上看到了英特爾在GPU生態、消費類應用、遊戲方面的誠意。 在資金有限的前提下,可以獲得最新的GPU技術,在很多應用場景中都有很多亮點,再加上藍戟的第三方設計和良好的散熱效能,英特爾ARC A750在安裝時就可以寫進榜單。