“傳統架構已經使用了幾十年,但在人工智慧時代,這樣的架構已經不夠用了。 近日,在北京舉行的ARM技術研討會年度技術大會上,ARM高階副總裁兼基礎設施事業部總經理Mohamed Aad發表了這樣的表態。
目前,在人工智慧的推動下,雲計算基礎設施正在經歷一波變革。
底層架構需要完全創新
下面的圖 1 展示了傳統的伺服器體系結構。 在過去的幾十年裡,幾乎所有伺服器都遵循以通用、現成的 CPU 為中心的架構,兩端都連線著記憶體和多個加速器。
在人工智慧時代,這樣的架構已經不夠用了。 根據AWAD的說法,“在這樣的架構下,CPU和加速器之間的介面直接限制了產品的最終效能水平,因為所有的加速器都必須通過單個CPU訪問額外的記憶體,這並不能實現記憶體一致性,這意味著加速器的效能無法得到充分利用, 因此不能很好地支援生成式人工智慧時代的需求。 ”
傳統雲計算伺服器架構與新架構(**ARM)的比較。
為了應對日益複雜多樣的市場需求,基礎設施專業化正在成為行業趨勢。 越來越多的雲計算廠商開始定製甚至開發自己的晶元,其主要目的是為其伺服器集群提供最合適的基礎設施,以實現最佳效能。 從阿里平頭革推出易天710,崑崙芯推出K100、K200、R200系列AI加速卡,到谷歌云推出全新AI晶元Cloud TPU V5E,以及近期雲計算巨頭Microsoft也發布了AI加速晶元MAIA100和CPU晶元Azure Cobalt 100,正式加入核心製造行列。 據了解,上述晶元產品目前主要用於服務於公司或母公司的雲計算業務。
雲計算供應商正在構建更適合其業務需求的伺服器集群。
通訊基礎設施專業化的需求不僅存在於雲計算提供商中,也存在於5G雲網路基礎設施提供商中。 聯想集團副總裁、雲網融合事業部總經理關洪峰介紹了目前5G專網建設情況,來自教育、製造、交通、零售、環保、政務等不同領域的客戶對5G專網有著不同的要求。 關洪峰表示,不同垂直行業的客戶對個性化服務有強烈需求,希望通過更多定製化的基礎設施建設解決方案,降低5G專網的建設成本。
關洪峰介紹了雲網融合在行業的發展情況。
如何優化計算基礎設施?
為了應對AI給雲計算基礎設施帶來的巨大計算壓力,需要從架構的底層對系統進行創新。 以現代系統架構為例,將單個儲存器和單個CPU連線到多個加速卡的結構進行了調整,以儲存器、定製CPU和加速卡對應的結構。 這樣一來,加速卡就可以有效地與CPU和記憶體聯動,實現整個裝置的記憶體一致性。 這個思路下更重要的是定製能力,也就是上圖中定製的CPU和加速卡是否能夠靈活配置。 這也是雲計算廠商面臨的乙個共性問題:產品中需要突出哪些功能,必須實現哪些功能,必須有足夠的靈活性。
ARM為雲計算廠商優化效能、定製功能提供了助推器:一方面提供了功能強大的核心,另一方面又允許使用者在此基礎上進行個性化改造,從而幫助客戶快速實現產品上市。 例如,英偉達GH200 Grace Hopper超級晶元採用ARM架構,使用72個ARM Neoverse核心,結合英偉達自家的GPU,進一步優化晶元的效能,其AI效能相比基於x86架構的系統可以提公升10倍。 近日,AWS發布的GR**ITon4也是基於Arm Neoverse平台的處理器設計。 與 GR**iton3 相比,處理器速度提高了 30%,核心數量增加了 50%,記憶體頻寬增加了 75%。
Mohamed Awad 在北京舉行的 Arm Tech Symposia 年度技術大會上發表了主題演講。
自主研發的晶元可以更大程度地滿足自身的業務需求。 對於像AWS和阿里雲這樣的雲計算服務提供商來說,他們是應用端,因此這類企業會根據自己的用例和工作負載,圍繞伺服器、機架甚至資料中心進行定製。 然而,並不是每家公司都擁有AWS成熟的技術實力,在晶元研發上實現高度的自主性。
為此,ARM為其合作夥伴提供了另一件“法寶”——ARM Neoverse計算子系統(CSS),一方面可以充分發揮Neoverse平台的效能和每瓦效率優勢,另一方面可以幫助晶元企業減輕晶元壓力,提高上市時間效率。
在接受《中國電子報》採訪時,AWAD表示:“通過使用我們的Neoverse CSS,有乙個合作夥伴的專案從概念到流片只用了13個月。 ”
借助Neoverse CSS,ASIC設計公司可以快速啟動設計專案,並使其設計隨時提供給他們需要的客戶IP** 供應商可以為 Neoverse CSS 預整合、預驗證和預優化高階 IP商業韌體解決方案公司可以在晶元流片之前開始開發晶元。 Microsoft上個月發布的最新Azure Cobalt 100也是建立在Neoverse CSS之上的。
除此之外,ARM在優化雲計算的價效比方面也做了很多努力。 記者在活動現場展台了解到,在相同的網路、相同的記憶體比例、相同的VCPU數量、相同的磁碟和應用負載下,基於ARM平台的例項相比x86至少具有20%的效能優勢,並且還能實現至少20%的成本節約。 在一些特定的計算密集型場景下,如H265**編碼,其效能是x86雲例項的兩倍。
ARM架構追求更高的效能和更低的成本。
完整的生態系統為晶元設計提供了“加速器
在ARM的發布會上,有兩個數字給記者留下了深刻的印象:13和80。
13 指的是通過使用 Neoverse CSS,晶元設計在短短 13 個月內就完成了從概念到流片的整個過程。 而 80 是指通過使用 Neoverse CSS,企業節省了相當於 80 名工程師一年的開發時間。
當被問及為什麼CSS可以幫助企業縮短晶元設計週期時,ARM中國全球副總裁鄒婷表示:“乙個完整的生態系統是關鍵,ARM的生態系統可以為晶元開發的各個階段保駕護航。 ”
Arm中國全球副總裁鄒婷在北京舉行的ARM技術研討會年度技術大會上發表演講。
在設計工具方面,Cadence 和 Synopsys 等公司提供經過驗證的 EDA 工具在IP設計方面,RAMBUS提供了預整合IP,已經整合了儲存器、安全和外設等功能在晶元設計方面,AdTechnology、Alphaw**e Semi、Broadcom、Capgemini、Faraday Technology等公司可以提供NeoverseCSS和其他ARM IP和方法的設計服務和專業知識在晶元代工方面,有來自英特爾IFS(Foundry Services)和台積電等代工合作夥伴的技術,可以為晶元設計公司提供領先的工藝節點和先進的封裝技術。
用鄒婷的話說,選擇ARM就等於選擇了一條久經考驗的產業鏈。 從EDA工具到晶元設計再到代工流片,ARM及其現有合作夥伴已經實現了全程的跑通和驗證,新客戶可以在常規流程中“抄作業”,從而專注於產品創新,打造差異化競爭力。
在ARM年度技術大會上,台積電相關負責人表示:“作為製造環節,我們與包括ARM在內的設計生態夥伴保持長期緊密合作,為客戶提供經過驗證的設計解決方案。 台積電與ARM多年來積累了大量合作經驗,在開發新技術的同時,實現了客戶與合作夥伴同步開發與優化,加速產品設計開發與市場投放。 ”
在中國,越來越多的企業看到了ARM現有的生態優勢,於是紛紛加入到這個生態圈中,成為其中的一部分。 例如,國內汽車電子軟體公司智聰科技,為汽車晶元等汽車相關產品提供基礎軟體和工具軟體,也最大程度適配ARM核心的晶元。 這與ARM建立了良好的生態連線有很大關係。
ARM 的生態系統使合作夥伴能夠更輕鬆地構建定製晶元並對其進行改進,以跟上時代和客戶需求的步伐。 ARM 及其生態系統合作夥伴正在積極開展許多計畫,例如 AMBA、Chi、C2C 和 UCIE。 ARM 正在推動底層介面和系統架構之間的行業一致性,以實現創新的多晶元 SoC 設計。 目前,半導體行業最熱門的技術路線探索,也是ARM及其合作夥伴的到場。 例如,SocioNext基於Neoverse CSS技術的多核CPU晶元,正在台積電的2nm工藝節點上設計和開發,為伺服器CPU、資料中心AI邊緣伺服器和5G 6G基礎設施提供解決方案。 展望未來,Arm 將繼續與各方合作,確保高效能、高效率的解決方案廣泛可用,以幫助滿足對 AI 的巨大需求。
作者丨季曉婷編輯丨張欣怡梅 編輯丨Maria 製片人丨連曉東