人工智慧發展得太快了! 當人們還沒有完全體會到文盛溫和文盛圖大模型帶來的巨大便利時,OpenAI SORA就來了! 它的誕生標誌著AI模型開始進入乙個更加“先進”的文盛**時代! 現在,有了SORA模型,任何人都可以簡單地輸入簡單的文字,以產生詳細的、具有視覺吸引力的**。
可以預見,大量文盛機型將迅速推出,勢必會極大地推動影視、廣告、傳媒、短片等行業的快速發展。 同時,海量的非結構化資料也將以更快的速度增長,這對儲存系統提出了更高的要求和挑戰。
除了對算力的巨大需求外,AI對儲存能力的需求也非常高。 AI對儲存的“剛性要求”是什麼?
訓練資料儲存AI模型的訓練通常需要大量的資料,包括影象、文字、音訊、**等各種型別的資料。 這些資料需要儲存空間來儲存和在預處理、特徵提取和模型訓練期間讀取。
模型引數儲存:深度學習等AI模型的引數規模往往非常大,GPT等大型語言模型的引數數量可以達到數十億甚至數千億。 訓練好的模型引數需要長期儲存,以備後續使用或進一步優化。
儲存中間結果:訓練過程中產生的中間結果、日誌資訊、版本迭代記錄也會占用儲存空間。
高速接入要求AI訓練對IO效能要求很高,尤其是對於那些大規模平行計算任務,高效的分布式儲存系統是必不可少的,可以快速讀寫大量資料,提高訓練效率。
實時 近乎實時的資料處理在AI推理階段,特別是對於實時或近乎實時的AI應用,如智慧型安防監控、自動駕駛等,需要快速儲存和處理源源不斷的新資料流。
人工智慧的發展推動了對高容量、高效能儲存技術的需求,包括 SSD、分布式檔案系統、物件儲存服務和其他儲存解決方案。 同時,也推動了儲存架構的創新,比如使用快取加速和分層資料儲存來滿足不同級別的儲存需求。
針對AI的儲存需求,昆騰已經做好了完美的布局,推出了Myriad、Stornext和ActiveScale儲存系統的“三駕馬車”。
昆騰的 Myriad 全快閃記憶體橫向擴充套件檔案和物件儲存平台
Quantum Myriad 是一款專為現代資料中心和 AI 工作負載而設計的高效能儲存解決方案。 這款全快閃記憶體儲存平台強調其速度、可擴充套件性和與硬體無關的設計,可滿足資料密集型工作負載的需求,尤其是涉及 AI 模型儲存、訓練資料管理和高效能計算用例的工作負載。
全快閃記憶體設計Myriad平台專為快閃記憶體驅動器而設計,利用快閃記憶體技術的高效能和低延遲,使其成為現代企業非結構化資料儲存需求的理想選擇**。
橫向擴充套件體系結構:無共享可擴充套件架構意味著系統可以隨著資料的增長而水平擴充套件,而不會犧牲效能,延遲極低。
多協議支援客戶端元件包括對 NFS(網路檔案系統)、SMB(伺服器訊息塊,即 Windows 檔案共享協議)、S3 物件儲存協議的支援,以及可能的專有服務和 GPU 直接連線服務,以滿足不同的資料訪問需求。
檔案和物件儲存融合:既作為檔案系統執行,又作為物件儲存平台執行,支援混合工作負載,並促進對不同型別資料的統一管理和訪問。
資料服務層功能豐富:支援內聯重複資料刪除和壓縮,減少儲存空間消耗; 提供快照和轉殖功能以加快備份和恢復操作; 此外,AI ML 資料處理經過優化,可加速機器學習和深度學習模型的訓練。
Kubernetes 編排通過採用 Kubernetes 容器編排技術,Myriad 的微服務架構可以實現更好的資源分配和故障恢復,進一步降低時延,提高系統的併發處理能力。
高效能和低延遲:基於快閃記憶體和RDMA(遠端直接記憶體訪問)技術,即使在高負載下也能保持高水平的IO效能。
昆騰 StorNext 共享儲存檔案系統
昆騰 StorNext 是乙個高度可擴充套件的共享儲存檔案系統和資料管理平台,以其卓越的效能、大資料傳輸速度和整合多種儲存介質的能力而聞名,尤其是在 ** 和娛樂行業。 StorNext 具有一些關鍵功能,使其成為支援 AI 應用程式需求的有效方式。
高效能儲存: AI 工作負載,尤其是深度學習和機器學習訓練,需要快速、持續地大規模訪問資料。 StorNext 提供的高速檔案系統和資料遷移能力保證了訓練資料的高效流動,從而縮短了訓練週期。
資料管理和分層儲存:StorNext 支援資料生命週期管理,可根據資料的重要性、頻率和成本,自動在不同層儲存介質之間遷移資料,有助於優化從原始資料引入和預處理到模型訓練再到 AI 專案模型部署的整個過程的成本效益。
雲集成StorNext 與 AWS、Azure 和 Google Cloud 等公有雲服務整合,使使用者可以輕鬆地在雲中大規模儲存和處理資料,這對於使用雲計算資源的 AI 訓練和分析特別有用。
大規模資料處理能力AI 應用程式通常涉及處理 PB 級和 EB 級的非結構化資料,而 StorNext 能夠管理和處理此級別的資料量,以確保資料完整性和可用性。
跨平台支援得益於 Stornext 的 POSIX 相容性和廣泛的 API 支援,它可以與各種作業系統和應用程式環境無縫連線,使 AI 開發人員可以輕鬆地在不同的 AI 框架下工作。
昆騰 ActiveScale 物件儲存系統
昆騰 ActiveScale 是乙個高度可擴充套件的物件儲存系統,用於儲存和管理大量非結構化資料。 對於AI工作負載,昆騰ActiveScale主要體現在以下幾個方面:
大規模資料儲存人工智慧和機器學習專案通常涉及大量資料的收集、儲存和處理。 ActiveScale提供基於物件的儲存架構,可以輕鬆擴充套件到EB級,以滿足AI訓練所需的大規模資料儲存需求。
構建資料湖ActiveScale作為資料湖的基礎設施,可以集中儲存各種非結構化資料,如影象和日誌檔案,這些都是AI模型訓練的重要輸入。
資料分析友好通過與Hadoop、Spark等大資料處理框架整合,ActiveScale可以支援AI相關的資料預處理和特徵提取,簡化AI開發過程中的資料準備。
高價效比ActiveScale通過結合磁碟、磁帶等低成本儲存介質的分層儲存策略,實現對冷熱資料的高價效比管理,幫助企業在控制成本的同時應對AI應用帶來的巨大儲存壓力。
API 整合ActiveScale支援S3介面和其他標準API,可以輕鬆與各種AI開發平台和服務整合,使資料可以直接流入AI訓練管道。