近年來,隨著人工智慧、5G、物聯網、雲計算等新興技術和產業的快速發展,資料量正以不可估量的速度爆炸式增長。 根據 IDC** 的資料,從 2015 年到 2025 年,全球資料總量將增長近 20 倍,達到 175 澤位元組。
在科技時代,海量資料產生了對算力的巨大需求,進而推動了高效能、高計算的晶元成為行業發展的驅動力和新趨勢。
在市場對高效能晶元需求不斷增加的同時,也進一步加快了晶元的迭代週期,刺激晶元設計企業不斷提公升晶元技術含量,縮短交付時間,提公升核心競爭力。 另一方面,隨著產品的迭代和越來越先進的製造工藝,對IT資源的需求以及晶元設計帶來的不斷增長的開發周期和成本,逐漸成為擺在晶元設計企業面前的痛點和挑戰。
特別是近年來,中國中小型晶元設計公司的數量一直在增加。 據中國半導體行業協會統計,中國晶元設計企業數量從2015年的736家增加到2023年的3451家,其中約84%是員工100人以下的小微企業。
受限於自身規模、實力和技術積累,小微企業在晶元開發設計過程中無法完全滿足自身的人力、算力、軟體等剛性需求,容易造成資源利用率低、研發成本高、技術成果轉化緩慢等現實痛點。
晶元設計道路上的“路障”
不難發現,現代晶元設計,尤其是CPU、GPU、NPU等高階晶元設計,計算、驗證、**的工作量是過去的數倍。
對於中小型晶元設計企業來說,當驗證需求高峰期到來時,會出現資源短缺,花費大量資金購買伺服器進行物理驗證不符合公司發展階段的要求。
因為專案開發不同階段對算力的需求是波動的。 一般晶元設計週期一般在12個月以上,包括產品定義、前端設計、IP驗證、SOC驗證、綜合、布局佈線等階段,不同階段對算力的要求不同。
晶元開發周期與IT資源配置的關係圖。
在這種情況下,晶元設計公司很難準確平衡資源供需,如果浪費多了,就少了他們需要反覆採購、構建和維護,即使按照中間值準備,當某個時間點的任務數量激增時,就會出現資源不匹配的情況。
即使是大型晶元設計公司,通常也存在不同專案團隊之間的資源競爭,公司資源總是有限的,資源配置難以靈活,同時出現“排隊”和“閒置”的不匹配。 這種不匹配將導致資源利用率低,影響研發進度。
可以看出,對於大多數晶元設計公司來說,計算資源規劃和成本之間的平衡是一門藝術。
另一方面,晶元設計環境複雜,企業建設難度大。 由於晶元設計行業普遍缺乏專業人才,中小型企業沒有專門的IT CAD團隊進行研發環境的部署和維護,所以如果想要完全搭建本地研發設計環境,周期長且複雜,人員跟不上, 這需要巨大的勞動力成本。
整體來看,“資源匱乏、人力匱乏、工具匱乏”等已成為晶元設計企業面臨的共同問題
急需資源:企業在流片前需要大量的算力進行驗證,本地資源難以滿足。
缺乏專業人員:集群環境複雜,集群運維難度大。
專業管理工具不足:由於缺乏易於使用的集群管理和排程軟體,集群環境管理變得困難。
您是否有足夠的伺服器資源來快速部署它? 如何應對對算力的飆公升需求? 如何有效平衡公司的研發成本? IT CAD工程師短缺、晶元設計環境複雜難建的困境,該如何解決?
一系列問題無疑成為擺在晶元設計企業面前的“路障”。
挑戰之下,晶元設計企業如何打破這種局面?
晶元設計開啟“上雲”時代。
這樣一來,晶元設計企業既要考慮專案算力的彈性需求,又要避免不必要的時間消耗。
將晶元設計引入雲端似乎是目前最好的解決方案。
晶元設計遷移到雲端後,公司可以按需從雲廠商處購買和擴充套件,可以靈活快速地滿足對算力的波動需求。 算力需求高峰過後,可以快速釋放雲資源,從而節省相關成本。
這種彈性為開發人員提供了靈活性、敏捷性和可伸縮性,從而提高了資源利用率。 特別是在晶元製造工藝不斷發展、晶元整合度越來越高的趨勢下,大量的計算、驗證、高階工作都需要強大的IT資源作為支撐,僅企業在建設IT資源和裝置上投入的人力物力就會非常大。
因此,將晶元設計遷移到雲端將成為晶元設計公司“降本增效”的必由之路。
簡單來說,晶元上雲的本質就是用算力換時間,用算力來節省人力,通過雲彈性算力平衡成本投資,解放生產力。
相較於過去晶元設計公司部署本地算力的模式,雲平台可以靈活利用資源,隨時開放,可以實現算力需求曲線的平滑波動和高資源利用率,滿足各種業務應急需求。
可以預見,雲正在成為晶元設計行業的一種趨勢,IC在雲端設計並靈活調整以滿足計算資源需求的時代已經到來。
在這方面,雲提供商也在積極部署。
早在2017年,美國新思科技、Cadence等幾家EDA廠商就開始向雲端提出晶元設計理念,AWS等雲計算公司、Microsoft提供了晶元雲解決方案。
例如,新思科技和台積電聯合部署了基於雲的設計和晶元製造平台,幫助台積電成為第一家實施雲設計的代工廠。 Synopsys還與台積電合作,在Microsoft Azure平台上實施了新的基於雲的時序簽核流程,以加快片上系統開發效率。
在歐美,晶元設計向雲端遷移已是市場共識,國內外主流晶元設計廠商、代工、EDA公司紛紛轉向雲設計**。 與國外相比,國內晶元設計向雲端的起步始於2019年左右,包括阿里雲、騰訊雲、紫光雲、華為雲在內的眾多雲平台開始探索高效能計算場景。
除了解決晶元設計彈性算力需求的痛點外,公有雲還擁有豐富全面的生態合作體系,銷售鏈協同,為晶元企業提供更全面的服務。
然而,業界對於如何選擇雲解決方案沒有絕對的標準,有太多的案例可供借鑑。
除了按量付費的公有雲方式外,還有一種私有雲方式,即在本地搭建晶元設計雲,滿足自身的晶元設計需求。 因為隨著一些晶元設計公司規模越來越大,晶元設計除了算力彈性之外,還需要一些虛擬化需求,所以構建晶元設計私有雲來使用和完善固定資源池逐漸成為一種趨勢。
如果一家大公司全部購買公有雲,成本會比較高,更傾向於在本地搭建乙個固定的資源池,利用私有雲的資源來滿足日常使用,然後涉及彈性算力部分,與公有雲結合,形成混合雲模式。
此外,一些企業已經部署了一些硬體裝置,上雲並不意味著將所有本地裝置都轉移到雲上,還可以通過部分上雲,即將本地裝置和資源預留為常備算力,輔以雲上計算資源的彈性補充,兩者協同可能是更具成本效益的解決方案。
據了解,目前AWS、Azure、阿里雲等龍頭雲商主要提供公有雲,晶元設計私有雲部署的參與較少,紫光雲、迅通科技、常春藤開源科技(HPC Insight)等企業較多,既有公有雲,也有私有雲。
值得注意的是,相較於依賴第三方雲平台和底層資源的迅通科技、常春藤開源科技,紫光晶元雲的公有雲依託自有紫光雲平台,與紫光集團旗下公司合作,在私有雲底層資源方面做私有雲場景, 全方位打造完整的晶元設計環境,從算力、CAD工具、集群排程管理等關鍵環節入手,達到降本增效的效果。
總之,上雲晶元設計平台不再是乙個艱難的選擇。 公有雲、私有雲和混合雲都是應對高效能晶元設計挑戰的有效解決方案,但它們之間存在一些差異,使用者可以選擇適合自己需求的路徑和模式。
構建晶元設計環境很難!
可以看出,晶元設計的雲可以幫助企業在算力需求、效率和成本上實現價值平衡。
但回到幫助企業縮短晶元設計週期的問題,只在雲端提供算力支援只是基礎服務。 由於缺乏專職的IT CAD工程師等人才,一些企業即使獲得雲計算資源,也很難快速搭建晶元設計環境。
如文章開頭所述,晶元設計環境複雜,缺乏專業人員和管理工具,缺乏易於使用的集群管理和排程軟體,這使得晶元設計集群環境的管理和運維變得困難。
對此,構建專業的設計環境已成為晶元設計企業面臨的新挑戰和新需求。
從行業現狀來看,行業使用者最熟悉的是IBM的集群核心軟體LSF,它負責計算資源的管理和批處理作業的排程,為使用者提供統一的集群資源訪問介面,讓使用者透明地訪問整個集群資源, 同時提供豐富的功能和可定製的策略。
目前,LSF基本上是高效能計算環境中不可或缺的基礎軟體。
在晶元設計領域,LSF排程工具通常與Azure、AWS等雲提供商合作,幫助LSF更高效地排程雲資源。
在國內,也有很多公司在這裡嘗試。 例如:
迅通科技推出IC設計研發雲平台,統一協同管理企業本地和雲端複雜的研發環境。
Ivy Technology 的 HPC Insights 對 HPC 集群進行監控和智慧型分析,幫助客戶全面控制集群資源並優化集群資源分配。
摩爾精英專注於“晶元設計到雲端”業務,為使用者提供高效易用的研發環境。
此外,我們也看到一些公司正在嘗試搭建平台,旨在利用AI技術幫助晶元設計公司優化IC設計,力爭在最優模式下設計出效能最好的晶元。
值得注意的是,在國產晶元設計上雲領域,紫光雲是行業首當其衝的踐行者和推動者。
據了解,作為國內最早推廣晶元設計雲的行業從業者之一,早在2020年左右,紫光雲就提前開始搭建和部署晶元設計雲。
紫光晶元雲總架構師耿家深指出,紫光晶元雲的發展背景和機遇主要是由於集團內部需求,集團旗下的一些晶元企業希望利用一些公有雲資源來滿足彈性資源的需求。
2020 年 8 月,Unisplendour 推出了 Chip Cloud 10版,正式對外推廣; 時隔不到半年時間,紫光晶元雲再次公升級,發布2版本 0。
據了解,紫籌雲10 更注重提供算力和設計環境,以滿足與算力和設計環境相關的痛點和需求。 以及公升級後的紫籌雲20服務更全面——通過提供專業的私有化晶元設計環境和靈活的公有雲資源,為晶元設計企業提供完整的混合雲解決方案。
可以理解,紫光晶元雲的初衷主要是服務於集團內部的晶元設計公司。 然而,在這個過程中,我們看到了一些晶元設計企業的共同需求,特別是近年來,湧現出一大批中小型晶元設計企業,從而衍生出對計算資源和整個晶元設計環境建設的巨大需求。
因此,通過服務內部企業過程中的經驗和技術積累,紫光晶元雲業務形成了標準化的晶元解決方案,進而推廣使用給行業客戶。
除了算力之外,還借助本地化的專業CAD IT團隊和豐富的雲上晶元設計實踐經驗,幫助企業梳理業務狀態,搭建晶元設計環境,負責後期的技術支援和運維服務。
其中,晶元設計環境中的兩大關鍵產品是紫信排程軟體和CAD管理平台。
面對晶元設計場景,紫核排程器可以在資料中心和雲端快速構建和管理異構高效能計算集群,為使用者提供彈性資源和滿足業務需求的統一資源排程管理平台,提高資源利用率。
面對排程軟體依賴海外產品的現狀,紫信排程旨在解決行業瓶頸問題,實現排程軟體的國產化。 耿家神表示,“紫核排程器在加入IBM的LSF的基礎上,進一步開發了多集群排程、提交作業引數過程中的自動引數補全替換等新功能和特性,優化和完善了開源排程器在大規模排程中的效能瓶頸。 ”
總之,面對行業老牌競爭對手LSF的傳統優勢,紫信排程選擇尋找新途徑,結合行業最新的容器排程和AI等新技術,進行一些改進和優化,實現差異化競爭。
有業內人士表示,過去接觸過的很多客戶都使用過進口排程器,但是在改用國產工具時,對原有的研發流程和排程進行調整和轉換是非常麻煩的。 耿家申表示,自主研發的國產紫核排程器可以從底層相容國際排程器,在保留開發者過去使用習慣的同時,解決了“卡脖子”的問題。 結合CAD能力和經驗,紫光晶元雲平台可有效提公升上、中、下層整體聯動效率,幫助客戶降低成本,提高晶元設計效率,並可共同適應落地場景。
該CAD能力是指紫光芯雲的CAD管理平台,是IC設計行業ITCAD運維管理的一站式管理平台,橫向支援多場景統一排程,縱向支援算力、儲存、作業的執行監控,以及集群和任務的智慧型排程, 可為使用者提供快速、穩定、高可靠、高效、低成本的集群管理服務,打造專業的晶元設計環境,提高晶元研發效率。
據悉,紫光晶元雲的CAD管理平台既可以管理自己的Zixin排程器,也可以管理LSF排程器。 由於很多客戶已經購買了LSF軟體,所以LSF管理軟體的更新速度較慢,在舊架構設計的基礎上會出現功能缺失的問題,不會根據一些使用者需求進行快速迭代的更新。
相比之下,紫光雲CAD管理平台可以快速響應客戶需求,對功能進行更新和迭代。 因此,在目前LSF排程器市場占有率普遍較大的行業形勢下,可以通過CAD管理平台支援對LSF排程器進行一些視覺化管理和監控,逐步實現晶元設計環境核心軟體的國產化滲透。
整體來看,清華紫光作為結構良好、開箱即用的雲晶元設計平台,為晶元設計企業提供強大、靈活、安全的計算集群和儲存資源池,配備資深IT CAD專家團隊,結合紫光集團內部晶元設計企業的最佳實踐,幫助晶元設計企業構建專用的私有雲設計環境, 並提供一站式設計服務+雲服務打包交鑰匙解決方案交付。
與其他平台相比,紫光晶元雲具有高效能、高安全性、混合部署、最佳實踐、生態運營等多重優勢。
客戶效應是第一說服力
對於晶元行業來說,在設計到雲上還有很大的想象空間。 然而,實現更多落地應用的前提是,雲平台不僅要保證高效率,還要獲得晶元設計公司足夠的信任。
Unisplendour晶元雲在這方面具有優勢。 據耿家深介紹,紫光晶元雲是基於紫光集團從核心到雲的整體戰略布局推出的,在推向市場之前,已經經過紫光集團內部晶元設計企業的充分驗證,形成了晶元在雲上設計的最佳實踐。
在實際部署中,晶元設計企業最關心的問題是能否提高資源利用率,自身的資源利用率又如何? 只有了解了這些,我們才能做出更好的調整和優化。
針對這一問題,紫光晶元雲平台在幫助客戶降本增效方面取得了不錯的成績
目前,許多晶元設計公司已在多地設立研發中心,紫光雲晶元團隊針對其分散的資源建立了集中專屬的雲晶元資源池,然後同時部署CAD管理平台和紫信排程器進行分析優化,將客戶的CPU計算利用率從50%提高到80%, 幫助使用者提高整體效率。
此外,晶元雲平台中的視覺化管理軟體還可以幫助客戶選擇硬體裝置,通過分析硬體資源的比例,幫助合理採購伺服器、記憶體等硬體資源,從而實現成本節約。
可以簡單理解為,對於涉及研發效率低、多地硬體資源採購不合理的問題的跨區域甚至跨國晶元設計公司來說,紫光雲晶元平台可以通過集群實現雲端和本地算力的統一管理,有效解決多地協同的問題, 提高資源利用率;同時,優化客戶的硬體配比,減少不必要的成本浪費。
在諸多優勢的加持下,紫光晶元雲提公升了眾多晶元設計企業的信心。
除了巨大的算力需求和IT CAD設計環境外,晶元設計還有EDA工具、IP、PDK等,這些都是晶元設計企業成本最高、投資最大的部件。 對於絕大多數小微晶元設計企業來說,他們沒有太多的議價能力,而借助紫光晶元雲平台現有的生態合作夥伴,這些都可以得到更好的支援。
耿佳申表示,紫光晶元雲已與多家EDA和IP合作夥伴合作,提供設計工具和IP服務。 通過與晶元行業上下游產業鏈和工具廠商的深度合作,共同打造全棧服務,實現共贏。
通過晶元雲平台,賦能中小晶元設計企業,賦能晶元設計速度“——這樣的產業巨集大規劃和發展願景,在紫光晶元雲的全面布局下,正朝著助力中國晶元產業發展的方向緩緩開啟。
結論
業內有人抱怨,“在大公司做晶元設計的時候,你不用擔心IT,你只需要抱怨IT; 當你來到一家小公司時,你會發現IT充滿了問題——計算能力、儲存、成本、工具、安全、環境等等,都需要考慮。 ”
“晶元設計上雲”的目的是將晶元設計公司從這些事情中解放出來,全身心地投入到自己的核心業務中。
從行業格局來看,AWS、Azure、阿里雲等公有雲領域的高手很多,Speedstone Technology和Ivy Open Source Technology都渴望嘗試私有雲業務,IBM和LSF在集群核心軟體領域獨樹一幟。
以紫光集團核心雲能力輸出,可部署公有雲和私有雲的行業全能者——紫光晶元雲致力於通過紫光雲+晶元專用管理平台(CAD管理平台+紫芯排程器)的支援,幫助晶元企業搭建專業的設計環境,應對算力需求的挑戰, 極大實現資源共享、技術共享、平台共享,加速中國半導體產業新公升級。
紫光晶元雲業務諮詢
聯絡人:紫光雲**客服(**與微信同號)。