龍年伊始,AI領域又傳來一則重磅訊息:OpenAI發布文生**大模型SORA,生成式AI迎來了新的里程碑。
從技術角度來看,SORA的演化速度幾乎令人難以置信。 2023 年 6 月發布的 Gen-2 僅支援 4 秒的**生成和掉幀明顯像幻燈片一樣,11 月,Meta 發布了**一代大模型鴯鶓視訊可以生成 512*512,每秒 16 幀**,3 個月後,SORA 已經能夠生成任意解像度和縱橫比**,還可以執行一系列影象和**編輯任務, 根據文字提示建立詳細**,生成靜態影象**。
AGI行業的快速發展需要大量的模型訓練和推理,這帶動了對算力的持續高需求。 在實際應用中,並不是所有的計算資源都能得到充分利用,大量的算力在計算和資料處理過程中處於“閒置”狀態。
泛在的算力需要穩定的網路來連線各種計算資源,而開放網路的高頻寬、低時延、傳輸穩定、可靠等特點為泛在算力提供了更多的應用場景和可能性。 國內企業希望利用AI技術推動數位化和智慧型化的發展,但不知道該選擇哪家廠商提供網路服務。
星融源致力於打造泛在算力開放網路,覆蓋雲網、高效能計算、人工智慧、企業資料中心、園區接入等領域,支援分布式儲存、網路視覺化等功能,在保證規模、頻寬、時延和穩定性等效能的同時,大幅降低成本。
以SORA為例,由於SORA是基於“補丁”而不是整體**進行訓練的,類似於大型語言模型(LLM)中的文字標註,所有型別的視覺資料都被轉換為統一的表示進行大規模的生成訓練,這需要對大量資料進行高效處理
在不影響資料傳輸效能的情況下,簡化了網路架構,大大降低了使用者網路建設的成本。
網路路徑跳數減少到1跳,大大降低了業務時延。
簡化網路結構,降低運維和故障處理難度。
在網路效能方面,AsterFusion的AI網路解決方案具有以下優勢:
1.提高了單個網路的頻寬。
1)增加網絡卡數量,在初始業務量較小時考慮CPU和GPU共享,後期為CPU準備1-2個單獨的網絡卡,為GPU準備4-8個網絡卡;
2)提高單網絡卡頻寬,需要匹配主機的PCLE頻寬和網交換機的頻寬,興榮源200G、400G、800G乙太網交換機配合網絡卡,保證資料傳輸的高頻寬;
2.應用: RDMA Network (ROCE)。
1)借助RDMA技術,減少GPU通訊過程中的資料複製次數,優化通訊路徑,降低通訊時延;
2)易ROCE一體化提供複雜的ROCE相關配置(PFC、ECN等),幫助使用者降低運維複雜度。
3.減少網路擁塞。
1)降低網路側時延,提高GPU使用效率:超低時延降低至400ns;
2)通過DCB協議組減少網路擁塞:通過PFC、PFC Watchdog、ECN構建全乙太網零丟包、低時延網路。
3)雙網流量分配:CPU流量與GPU流量完全分離,減少不同網路流量的占用和干擾。
作為開放網路領域的先行者,興榮源持續為客戶提供效能優越、成本優勢明顯的產品和解決方案,幫助企業實現更高效的運營和發展。 依託先進的技術和豐富的經驗,星融源將為泛在算力的發展開闢更廣闊的空間,為行業帶來更多的機遇和可能性。
關注VX公眾號“星榮源Asterfusion”,獲取更多技術分享和最新產品動態。