算力租賃為何應運而生?
1)大型模型的興起推動了對算力的需求。
算力是AI大模型訓練的核心生產力,隨著AI大模型的快速發展,對智慧型算力的需求呈現爆發式增長趨勢。 根據IDC發布的《2023-2024年中國智慧型算力發展評估報告》,2022年中國智慧型算力規模將達到260eflops(每秒數百億浮點運算),預計到2027年,中國智慧型算力規模有望超過1117eflops,中國智慧型算力規模的復合年增長率將高達339%。預計到2030年,人工智慧驅動的全球算力將增長500倍,1000億智慧型算力的藍海市場已悄然開啟。
大模型的爆炸式增長帶來了算力需求的激增,其成功離不開萬張訓練卡的計算資源。 目前,流行的生成式大模型的訓練主要依靠以A100 H100為代表的高效能GPU算力,既能提供高效的資料傳輸能力,又能盡可能降低閒置算力。
在全球範圍內,GPT等一系列生成模型帶動了行業對算力的需求大幅增加,但短期內,高階GPU的產能和交付效率有限,導致GPU供需失衡。
2)在國內,國產GPU與海外先進GPU仍存在一定的效能差距,製造工藝的缺陷使得短期內無法大量生產,因此目前國內AI產業的發展仍需主要依靠以NVIDIA和AMD為代表的海外先進GPU。
由於技術上的代際差距和生態習慣的使用,近年來,中國的人工智慧計算晶元市場仍以英偉達為主。 IDC資料顯示,2022年中國AI加速卡出貨量約為109萬張,英偉達以85%的市場份額保持著較高的競爭優勢。 然而,在對抗和技術禁運的背景下,包括英偉達A800 H800在內的多款高階晶元已被禁入國內,中國AI大模算力面臨缺卡困難,短期內挑戰嚴峻。
2023 年 10 月,美國商務部工業和安全域性 (BIS) 發布了一系列出口管制規則,更新了對包括中國在內的禁運國家先進計算積體電路、半導體製造裝置以及支援超級計算應用和最終用途的物品的出口管制,並將 13 家中國實體列入實體清單。
在美國對中國高科技產業日益嚴格的限制威脅下,國內市場算力缺口進一步擴大,存量依賴和租賃需求激增。
英偉達顯示卡進口限制:受技術禁運影響,英偉達高效能GPU進口嚴格限制,國內市場趨緊。
利用現有資源:為了應對現有資源的短缺,國內企業紛紛轉向利用現有存量資源,包括優化現有裝置的配置,提高裝置利用率。
爆發式租賃需求:在成本壓力和市場需求的推動下,“買轉租”的趨勢越來越明顯,GPU算力租賃需求迎來爆發式增長。
如何了解算力租賃行業。
算力租賃是以租賃的形式向使用者提供算力或雲計算資源,在這個過程中,使用者可以根據自己的需要選擇資源的使用型別和時間,不需要承擔運維、公升級等工作和相應的費用。 算力租賃一方面降低了下游客戶靈活使用算力的門檻,更有利於眾多AI創業公司快速開發和應用產品和服務,另一方面也充分利用閒置的計算資源,提高計算資源的利用效率。
AI算力租賃的業務本質是,擁有大型模型訓練的軟體研發商需要從擁有GPU資源的廠商那裡租賃GPU算力。 出租人的利潤**主要是租金收入減去營業成本,主要包括固定資產折舊、資料中心日常運營、IDC機房租金、人員成本等。
算力租賃有三種商業模式:
在AI算力租賃市場中,根據租賃雙方的需求和資源,租金的衡量方式不同。 目前市場上常用的三種租金計量方法如下(三種計量方法可以相互轉換)。
每台伺服器租賃:按伺服器(含8個GPU)計算,按月收取租金,適合需要長期穩定使用大量GPU資源的客戶。 以較低的伺服器運維成本提供最新的 NVIDIA GPU。
按算力規模租賃:按每年p計租,可根據算力需求選擇合適的算力規模,實現更靈活的資源配置。
每GPU租賃:按GPU每小時計算租金,適合短期或臨時算力需求,可根據實際需求隨時調整卡數。
算力租賃市場的潛在發展方向:運營服務與解決方案。
目前,國內多家企業已實現在算力租賃領域的布局,相當一部分企業已做好未來更大規模擴張的規劃。 我們認為,算力租賃在短期內可以更好地應對目前我國計算資源稀缺的問題,但從長遠來看,如果想避免資源過剩、服務同質化帶來的激烈市場競爭,算力租賃行業的相關從業者可能需要更多地關注以算力排程為代表的運營服務。 以及AI運營工具和整體解決方案。英偉達、甲骨文等海外企業紛紛推出基於算力租賃的整體AI服務工具和解決方案,或將為我國相關產業的發展提供更好的指導。
這是報告的節選,是報告的原始PDF
資訊科技 - 算力系列二:算力租賃產業框架 - 中泰 ** [蘇毅] - 20240123 [第 23 頁]。
報告**:價值目錄