2024年,亞馬遜雲科技發布了基於ARM架構的第一代GR**ITON晶元,開創了雲計算廠商開發自己的通用處理器的先河。
在隨後的幾年裡,越來越多的雲廠商意識到,企業客戶對雲上算力效能的追求是無止境的,而滿足這一需求的唯一途徑就是從底層晶元開始全面重塑算力。
而gr**iton系列晶元也沒有停下自己的腳步。 在不久前舉行的2023 Re:Invent峰會上,亞馬遜雲科技發布了基於GR**ITON4的最新一代自研處理器GR**ITON4和R8G例項。
與上一代產品相比,GR**ITon4 具有更多核心、更高的記憶體頻寬,以及效能和能效的顯著提公升。
同時,gr**iton4 針對實際工作負載進行了優化,而不是執行分數,這可以真正改善實際的使用者體驗。
截至 2023 年底,亞馬遜雲科技已使用超過 200 萬個 gr**iton 處理器,推出超過 150 個基於 gr**iton 的雲主機,使用者超過 50,000 人。
其中,排名前 100 的 EC2 使用者也在使用基於 Gr**Iton 處理器的雲主機。
總體來說,推廣還是比較誠懇的。
從公布的資料來看,gr**iton4 的計算效能整體上比 gr**iton3 提公升了 30%。 其中,執行MySQL資料庫的效能提公升了40%,執行大型J**A應用的效能提公升了45%。
一到四代 gr**iton
從肉眼可見,gr**iton4和gr**iton3一樣,都採用了chiplet技術,這也是arm強烈推薦的技術路線。
Amazon Web Services 首席布道者 Jeff Barr 在他的部落格中提到,GR**ITON4 使用了 96 個 Neoverse V2 核心,每個核心有 2MB 的 L2 快取和 12 個 DDR5-5600 通道記憶體。
相比之下,上一代GR**ITON3的芯數為64,這次直接增加了50%。 記憶體頻寬已從 307GB 增加到 5367GB s,整體提公升75%以上。 L2 快取也從 1MB 增加到 2MB,這在效能方面有很大幫助。
Neoverse V2 核心,也稱為“Demeter”核心,基於 ARMV9 架構,面向 HPC、雲計算和超大規模資料中心市場。
根據ARM官方資料,Neoverse V2的IPC比基於ARMV8架構的Neoverse V1核心提高了40%。 此前,GR**ITON3 和 GR**ITON3E 使用 Neoverse V1 核心的 ArmV8 架構。
從 Amazon EC2 副總裁 D**id Brown 的介紹中可以看出,Gr**Iton 的設計針對實際工作負載進行了優化,而不是針對執行分數進行了優化。
為了說明什麼是“針對實際工作負載進行優化”,他分享了一張雷達圖,該圖看似複雜,但實際上非常簡單。
雷達圖列出了CPU微架構中涉及的主要引數,分為前端和後端兩部分。
前端主要是指令相關部分,後端主要是功能執行單元。 當然,前端和後端之間還有乙個命令控制器,負責將前端解碼後的指令分發給執行單元。
CPU 微架構需要前端和後端之間的緊密協作。 如果前端效率不高,會導致後端執行單元等待新指令,從而產生效能瓶頸。 如果後端效率不高,執行速度太慢,新指令無法進來,也會導致效能瓶頸。
雷達圖中也有數值,數字越小,工作負載對這個引數特性的依賴性越小,這意味著CPU的這個引數特性對整體效能的影響越小。
換言之,數字越小表示處理器對該工作負載的效率越高,數字越大表示工作負載對處理器的依賴性越高。
借助此雷達圖,CPU 設計人員可以針對實際工作負載進行優化,而不是基於基準測試測試結果。
上圖說明了基準測試中的場景,該場景放大了某些引數特徵的影響。
例如,我們在這裡看到 L3 快取的值特別高,這會導致後端停頓的值很高。 此時,後端無法再接受新指令,這將造成效能瓶頸。
這張圖右側的三個雷達圖顯示了 Cassandra、Grovy 和 Nginx,它們在處理實際工作負載時會受到不同引數特徵的影響。
可以看出,這些應用同時受到幾種不同引數特性的影響。 如果要針對實際工作負載進行優化,則必須找到一種方法來降低這些數字。
例如,gr**iton4 對 gr**iton3 做了什麼。
如上圖所示,gr**iton4在執行MySQL時多維度下降,效能提公升40%。 當然,這也與記憶體頻寬等規格的提公升有很大關係。
無論如何,最後的雷達圖顯示了用於實際工作負載優化的 gr**iton4。
除了規格的提公升、實際工作負載的優化、日益複雜的安全威脅外,GR**ITON4 在安全方面也有了新的內容。
GR**iton4不僅繼承了上一代處理器的安全特性,還增加了加密的高速硬體介面,以保護資料的安全性和完整性。
同時,gr**iton4 還新增了分支目標識別(bti-branch target identification)功能,可用於確保分支跳轉到正確的目的位址,防止惡意軟體使用分支中的跳轉命令跳轉到意圖以外的段,從而提高系統的安全性。
與往年一樣,新的 GR**ITON4 處理器隨附帶有處理器的 EC2 主機。
預覽版中發布的第乙個 EC2 是 R8G,這是乙個記憶體優化例項,其 VCPU 數量和記憶體容量是上一代 R7G 的三倍。
這使得R8G在高效能資料庫、大資料分析等大型資料集場景中更具優勢。 R8G 的發布為記憶體敏感型工作負載提供了更好的價效比和能效。
2024年,亞馬遜雲科技發布了第一代自研的gr**iton處理器,亞馬遜雲科技成為首家研發自研通用伺服器處理器的雲廠商,這也是Arm伺服器陣營再次站穩腳跟的里程碑事件。
為了擴大效益,發布了功能更強大的GR**ITON 2,隨後GR**ITON 3在效能和能效方面不斷提公升。
事實上,去年亞馬遜雲科技還發布了 gr**iton3 的公升級版——gr**iton3e,主要優化了浮點運算和向量運算場景下的效能,這些能力只有在高效能計算領域才被更多關注。
現在看來,亞馬遜雲科技在2024年發布的gr**iton處理器,以及相應的雲主機,確實對伺服器市場產生了很大的影響。
如今,gr**iton晶元的應用範圍已經大大擴充套件。 這可以從亞馬遜雲科技 TOP100 客戶也在使用 gr**iton 例項這一事實中看出。 例如,SAP 在使用 Gr**Iton 服務後,通過更快的分析速度將成本降低了 35%,並將碳排放量減少了 45%。
5年間推出4代晶元的亞馬遜雲科技,利用gr**iton為雲廠商自研晶元探索了一條發展路徑:每一代晶元都帶來更高的效能、更豐富的選擇、更低的成本,從而滿足企業對雲上算力效能的無盡需求。
end