空來了! 昆騰儲存系統的“三駕馬車”滿足AI的剛性需求

Mondo 科技 更新 2024-03-01

人工智慧發展得太快了! 當人們還沒有完全體會到文盛溫和文盛圖大模型帶來的巨大便利時,OpenAI SORA就來了! 它的誕生標誌著AI模型開始進入乙個更加“先進”的文盛**時代! 現在,有了SORA模型,任何人都可以簡單地輸入簡單的文字,以產生詳細的、具有視覺吸引力的**。

可以預見,大量文盛機型將迅速推出,勢必會極大地推動影視、廣告、傳媒、短片等行業的快速發展。 同時,海量的非結構化資料也將以更快的速度增長,這對儲存系統提出了更高的要求和挑戰。

除了對算力的巨大需求外,AI對儲存能力的需求也非常高。 AI對儲存的“剛性要求”是什麼?

訓練資料儲存AI模型的訓練通常需要大量的資料,包括影象、文字、音訊、**等各種型別的資料。 這些資料需要儲存空間來儲存和在預處理、特徵提取和模型訓練期間讀取。

模型引數儲存:深度學習等AI模型的引數規模往往非常大,GPT等大型語言模型的引數數量可以達到數十億甚至數千億。 訓練好的模型引數需要長期儲存,以備後續使用或進一步優化。

儲存中間結果:訓練過程中產生的中間結果、日誌資訊、版本迭代記錄也會占用儲存空間。

高速接入要求AI訓練對IO效能要求很高,尤其是對於那些大規模平行計算任務,高效的分布式儲存系統是必不可少的,可以快速讀寫大量資料,提高訓練效率。

實時 近乎實時的資料處理在AI推理階段,特別是對於實時或近乎實時的AI應用,如智慧型安防監控、自動駕駛等,需要快速儲存和處理源源不斷的新資料流。

人工智慧的發展推動了對高容量、高效能儲存技術的需求,包括 SSD、分布式檔案系統、物件儲存服務和其他儲存解決方案。 同時,也推動了儲存架構的創新,比如使用快取加速和分層資料儲存來滿足不同級別的儲存需求。

針對AI的儲存需求,昆騰已經做好了完美的布局,推出了Myriad、Stornext和ActiveScale儲存系統的“三駕馬車”。

昆騰的 Myriad 全快閃記憶體橫向擴充套件檔案和物件儲存平台

Quantum Myriad 是一款專為現代資料中心和 AI 工作負載而設計的高效能儲存解決方案。 這款全快閃記憶體儲存平台強調其速度、可擴充套件性和與硬體無關的設計,可滿足資料密集型工作負載的需求,尤其是涉及 AI 模型儲存、訓練資料管理和高效能計算用例的工作負載。

全快閃記憶體設計Myriad平台專為快閃記憶體驅動器而設計,利用快閃記憶體技術的高效能和低延遲,使其成為現代企業非結構化資料儲存需求的理想選擇**。

橫向擴充套件體系結構:無共享可擴充套件架構意味著系統可以隨著資料的增長而水平擴充套件,而不會犧牲效能,延遲極低。

多協議支援客戶端元件包括對 NFS(網路檔案系統)、SMB(伺服器訊息塊,即 Windows 檔案共享協議)、S3 物件儲存協議的支援,以及可能的專有服務和 GPU 直接連線服務,以滿足不同的資料訪問需求。

檔案和物件儲存融合:既作為檔案系統執行,又作為物件儲存平台執行,支援混合工作負載,並促進對不同型別資料的統一管理和訪問。

資料服務層功能豐富:支援內聯重複資料刪除和壓縮,減少儲存空間消耗; 提供快照和轉殖功能以加快備份和恢復操作; 此外,AI ML 資料處理經過優化,可加速機器學習和深度學習模型的訓練。

Kubernetes 編排通過採用 Kubernetes 容器編排技術,Myriad 的微服務架構可以實現更好的資源分配和故障恢復,進一步降低時延,提高系統的併發處理能力。

高效能和低延遲:基於快閃記憶體和RDMA(遠端直接記憶體訪問)技術,即使在高負載下也能保持高水平的IO效能。

昆騰 StorNext 共享儲存檔案系統

昆騰 StorNext 是乙個高度可擴充套件的共享儲存檔案系統和資料管理平台,以其卓越的效能、大資料傳輸速度和整合多種儲存介質的能力而聞名,尤其是在 ** 和娛樂行業。 StorNext 具有一些關鍵功能,使其成為支援 AI 應用程式需求的有效方式。

高效能儲存: AI 工作負載,尤其是深度學習和機器學習訓練,需要快速、持續地大規模訪問資料。 StorNext 提供的高速檔案系統和資料遷移能力保證了訓練資料的高效流動,從而縮短了訓練週期。

資料管理和分層儲存:StorNext 支援資料生命週期管理,可根據資料的重要性、頻率和成本,自動在不同層儲存介質之間遷移資料,有助於優化從原始資料引入和預處理到模型訓練再到 AI 專案模型部署的整個過程的成本效益。

雲集成StorNext 與 AWS、Azure 和 Google Cloud 等公有雲服務整合,使使用者可以輕鬆地在雲中大規模儲存和處理資料,這對於使用雲計算資源的 AI 訓練和分析特別有用。

大規模資料處理能力AI 應用程式通常涉及處理 PB 級和 EB 級的非結構化資料,而 StorNext 能夠管理和處理此級別的資料量,以確保資料完整性和可用性。

跨平台支援得益於 Stornext 的 POSIX 相容性和廣泛的 API 支援,它可以與各種作業系統和應用程式環境無縫連線,使 AI 開發人員可以輕鬆地在不同的 AI 框架下工作。

昆騰 ActiveScale 物件儲存系統

昆騰 ActiveScale 是乙個高度可擴充套件的物件儲存系統,用於儲存和管理大量非結構化資料。 對於AI工作負載,昆騰ActiveScale主要體現在以下幾個方面:

大規模資料儲存人工智慧和機器學習專案通常涉及大量資料的收集、儲存和處理。 ActiveScale提供基於物件的儲存架構,可以輕鬆擴充套件到EB級,以滿足AI訓練所需的大規模資料儲存需求。

構建資料湖ActiveScale作為資料湖的基礎設施,可以集中儲存各種非結構化資料,如影象和日誌檔案,這些都是AI模型訓練的重要輸入。

資料分析友好通過與Hadoop、Spark等大資料處理框架整合,ActiveScale可以支援AI相關的資料預處理和特徵提取,簡化AI開發過程中的資料準備。

高價效比ActiveScale通過結合磁碟、磁帶等低成本儲存介質的分層儲存策略,實現對冷熱資料的高價效比管理,幫助企業在控制成本的同時應對AI應用帶來的巨大儲存壓力。

API 整合ActiveScale支援S3介面和其他標準API,可以輕鬆與各種AI開發平台和服務整合,使資料可以直接流入AI訓練管道。

相關問題答案

    2024 Sora 來了! “移動代理”也來了!

    近日,Open AI發布了一款基於文字生成超現實的工具Sora,各種震撼工具在科技圈引爆了螢幕,人氣持續發酵,佔據了AI領域的話題中心,被認為是AGI落地過程中的一大里程碑。新一波的人工智慧浪潮對人類未來的生產和生活方式帶來了巨大而深遠的影響,與此同時,基於大模型的智慧型體正在顛覆我們的未來。月日,...

    高階儲存力量Sora爆炸,全快閃記憶體儲存要火了

    AI大模型的發展正在取得長足的進步,從用於文字生成的ChatGPT到用於文生 的SORA到多模態互動不斷迭代。在大模型演進和實現的過程中,資料儲存系統面臨著效能挑戰 執行穩定 成本壓力。中科曙光儲存推出 Pastor 分布式全快閃記憶體儲存,採用業界首創的 XDS 技術,具有訓練加速 穩定性強 價效...

    Sora來了,你離AI還有多遠

    在當今瞬息萬變的技術時代,人工智慧 AI 蓬勃發展,湧現出許多前沿技術。比如OpenAI剛剛推出的另一款革命性產品 文字生成模型Sora,就已經在年初引爆了全網的熱議。在文盛 時代被顛覆的同時,人工智慧還能為我們做些什麼?大家都好奇體驗的AI,激發了科技愛好者的極大熱情,甚至引起了公眾的廣泛關注。通...

    空來了,誰的飯碗會被砸?

    OpenAI官網截圖。短短幾句話就能產生秒的爆炸 美國開放人工智慧研究中心 OPENAI 推出的生成模型SORA最近震驚了世界。OpenAI 推出 ChatGPT 才一年多,它再次投下了一顆重磅炸彈。文生 AI模型SORA有什麼了不起的地方?對行業有什麼影響?有哪些隱患?新華社記者為您解案 Sora...

    空來了,誰的飯碗會被砸?

    在當今的數字時代,生成模型不再是乙個陌生的概念。然而,最近,一種名為SORA的文盛大型模型引起了全世界的廣泛關注。索拉有什麼了不起的地方?它將如何影響行業?有哪些隱患?誰的工作甚至可能被砸碎?讓我們開始吧。.Sora 的神奇之處 SORA生成模型的驚人之處在於其高度逼真的生成效果。與傳統的生成技術相...