1月17日,WIM 2023(世界創新者大會)在北京舉行尚明東,DataCanvas聯合創始人受邀出席論壇並作題為“AI基礎軟體加速工業智慧型化公升級”的主題演講。 以下為尚明東先生的講話實錄:
2023年大模型的快速發展,點燃了全民對AI的想象,推動中國AI產業進入央企雲建設、智慧型計算中心建設、大模型建設“三節車廂”帶動的新發展階段。 同年5月,國資委提出建設國有央企“1+N+M”雲體系,即構建央企基礎公有雲、N產業公有雲、M企業特色私有雲,為算力雲建設提供架構基礎。
在大型模型的構建中,需要完整的基礎設施公升級,而大小模型的開發離不開“算力、演算法和資料”三大要素。 其中,硬體代表算力的進步,基礎軟體代表演算法的進步和硬體的效率,資料得到有效的儲存、計算和流通。
大型模型帶來對計算資源的需求井噴式增長
從2020年到2023年,大模型訓練的速度和效率將逐漸提高,對GPU並行性的要求將越來越高。
根據算力需求的計算資料,2023年全球大模型訓練所需的算力總量為87萬,以H100為例,預計2024年和2025年訓練算力需求將以兩倍的速度增長。 2023年H100總需求量為83萬,2024年將增至265萬。 隨著大模型的落地,推理端算力需求增長速度超過訓練端,推理端算力需求年增長率也超過訓練端。
國內領先的智慧型計算中心全棧軟體系統
隨著大模型時代的到來,智慧型計算中心形成了新的產業版圖,“算力、演算法、資料”三要素從根本上影響了智慧型計算中心的產業布局和生態發展。
在智慧型計算中心全棧軟體體系建設中,以智慧型計算硬體為底層,通過GCP智慧型計算雲大規模排程GPU算力,完成算力排程和租戶管理,形成AI訓練基地。 在AI基礎軟體層面,為企業提供AI全程訓練推理開發工具,支援“大+小”模型開發,提供模型服務。 頂層是大模型生態,通過構建AI MaaS+AIGC應用,有效管理開源大模型和垂直大模型,賦能行業應用。 全棧軟體體系的構建最終為企業提供全方位的計算服務、資料服務、演算法服務和應用生態服務。
智慧型計算中心的建設範圍包括六個部分:
基礎設施和機電配套系統的建設是建設範圍內最低的硬體層。 智慧型算力的採購和供應鏈,作為第一台GPU伺服器,受到供應的影響,成為影響智慧型算力中心建設進度的最關鍵因素。 整合智慧型算力系統,整合了智慧型計算中心的算力網路和架構儲存。 基於雲的作業系統是智慧型計算運營的基礎,使能大規模GPU的統一排程、優化、管理和加速。 智慧型計算運維,包括裝置智慧型運維、對外提供面向企業的特色服務、租戶管理、計費運維等。 AI能力構建層,即AI基礎軟體層,提供“大+小”模型全生命週期的構建、開發、管理和提供服務的能力。 作為中國人工智慧基礎軟體的領導者,DataCanvas為各行業提供智慧型計算軟體系統,包括底層智慧型計算硬體、支援智慧型計算應用管理的基仕針智慧型計算雲平台、智慧型計算雲運維管理、智慧型計算雲運營管理、智慧型計算雲作業系統,以及AI平台和大模型,提供大模型訓練推理、模型微調、模型操作等全生命週期的開發工作棧,形成AI核心的基礎軟體能力基礎。賦能不同行業的垂直開源模型,提供MaaS服務,最終構建基於智慧型計算中心的智慧型計算生態。
第 9 章 DataCanvas 成為智慧型計算的核夥伴
DataCanvas成立於2013年,以“創造智慧型,探索未知”為使命,以“助力全球企業智慧型公升級”為願景,通過自主研發的AI基礎軟體產品系列和解決方案,為千行百業的使用者提供基礎AI服務,幫助使用者輕鬆完成數智化轉型中模型和資料的雙向賦能, 低成本、高效率提公升企業決策能力,實現企業級AI的規模化應用。
在新一輪智慧型計算中心能力建設中,DataCanvas將充分發揮其在機器學習、資料科學和建模領域的專長,從技術支援、產品服務、人才培養、生態合作等方面賦予計算中心“智慧型核心”,構建有效的計算作業系統,提供越來越便捷的智慧型計算服務, 並將與不同的智慧型計算中心形成緊密的合作夥伴,構建高效的計算網路,形成演算法基礎設施建設,服務智慧型軟體。