近日,IDC發布了《2023H1中國軟體定義儲存(SDS)和超融合儲存(HCI)系統市場季度報告》。 報告顯示,在檔案儲存領域,XSKY排名第五,同比增長534%。
XSKY檔案儲存XGFS能夠得到市場的高度認可,並迅速增長其市場份額,這與以客戶為中心的需求開發、創新的技術突破以及貼近各行業數位化轉型的細分解決方案是分不開的。
XGFS v6 新版本3 版本,高效能檔案快取模組(以下簡稱XDcache)的推出,為醫學影像、雲桌面共享、CAD CAE工程設計**、基因測序比對、工業製造等場景帶來了多重效能提公升
企業應用軟體檔案儲存的效能挑戰
SMB 協議是一種傳統的 NAS 協議,允許使用者輕鬆訪問 Windows PC 上的網路共享和檔案資源。 除了最簡單的文件共享外,它還攜帶了非常多樣化的專業軟體來執行。
在醫療行業,隨著成像裝置精度的提高,PACS系統中的資料量正在迅速增長。 同時,醫療診斷實時性不斷提高,對整體PACS的響應時間提出了更高的要求。 此外,通過網際網絡和分級診療服務獲取歷史影象,也對二級歸檔儲存的讀取效能提出了挑戰。 面對數以億計的小檔案,傳統檔案儲存越來越慢,導致讀取滯後,降低醫院業務高峰的效率。 在工程設計與分析領域,CAD(計算機輔助設計)和CAE(計算機輔助工程)軟體廣泛應用於產品設計、建模、製圖、工程分析等。 隨著雲桌面的普及,大量在本地執行的專業軟體逐漸轉向自建雲。 雲架構提供了更高的安全性、靈活性、可擴充套件性和更低的成本,但某些專用軟體的體驗和執行效率低於本地。 在製造過程中,AOI(自動光學檢測)技術已成熟地應用於缺陷檢測系統。 質檢機每天可以生成數千萬個小檔案,這些小檔案儲存在深層路徑中,經過一定時間後需要自動歸檔或刪除。 如果這些檔案不及時寫入儲存,生產線的生產能力將大大降低。
儲存效能對於各行各業的生產力至關重要。 為了更好地支援細分領域的專業軟體,XSKY研究了大量專業軟體的IO模型。 研究發現,在 Windows 上執行的大量軟體以單併發、序列方式寫入儲存,IO 大小極小,通常甚至為 4 個位元組。 (注意:1 KB = 1024 位元組)。 例如:
乙個 PACS 軟體:寫入 517 KB 的映像檔案,先寫入 20 多個 4 位元組,然後寫入幾個大 IO。寫入完檔案後,請先讀取檔案的前 8 KB,然後再寫入下乙個檔案。 CAE 軟體:分析**時,生成乙個 2DS 檔案,大小為 747 KB,並由數十萬次 4 位元組追加寫入完成。 AOI 軟體:將 4-8 KB 的本地儲存合併為 20 MB 並將其上傳到共享儲存。 上傳寫入過程為 4 KB 追加寫入。
IOPS 是儲存基準效能測試中最常用的指標,高併發 4KB 讀寫通常用於衡量集群效能。 這種測試方法可以在一定程度上反映儲存效能,但與上述業務軟體的儲存訪問行為有較大差異。 小型 IO 的低併發、序列寫入需要儲存的超低延遲。 同時,由於IO很小,需要非常大量的寫入,所以即使是很小的延遲差異,也會給整體應用體驗帶來非常大的差異。 因此,部分門店在基線測試中表現良好,但在生產運營方面未能滿足需求。
傳統的分布式檔案供應商使用專有硬體 NVRAM
從儲存介質來看,從RAM、NVRAM、NVME SSD、SATA SSD到HDD,延遲逐步增加。 傳統的分布式檔案儲存通常引入 NVRAM 來提供低延遲訪問。 NVRAM(非易失性隨機存取儲存器)是一種計算機儲存器,即使在電源關閉時也能保留其儲存的資料。 與傳統的隨機存取儲存器 (RAM) 不同,RAM 具有易失性,在斷電時會丟失資料。
如上例所示,傳統儲存供應商通常通過專有硬體 NVRAM 和雙副本映象機制構建寫入快取。 對於客戶端下發的小IO同步寫入,將RAM寫入本地NVRAM並持久化到本地NVRAM,然後通過網路映象將其他節點的NVRAM寫入其他節點的NVRAM,然後將成功返回給客戶端。 這種方法會帶來許多問題:
普通的 x86 伺服器通常不直接支援 NVRAM,NVRAM 需要特定的硬體支援和整合;NVRAM 的增加導致硬體採購和維護成本增加兩個映象副本的資料冗餘度較低,雖然資料不會丟失,但如果兩個節點同時斷電,部分資料將無法訪問映象資料通過TCP網路協議傳輸,延遲高。
基於高效能網路ROCE構建軟體架構
作為一家專注於軟體定義儲存領域的專業化、新型“小巨人”企業,XSKY致力於通過軟體實現儲存管理和資料訪問控制。 XGFS 使用標準硬體 RAM、NVMe 和基於 ROCE 協議的三副本機制構建寫入快取。 對於客戶端下發的小IO同步寫入,資料同時寫入接入節點的RAM和NVMe磁碟,通過高速ROCE網路拷貝到其他兩個節點,然後返回客戶端寫入成功。
ROCE(基於融合乙太網的 RDMA)是一種基於乙太網的遠端直接記憶體訪問 (RDMA) 技術。 通過繞過作業系統的核心,直接將資料傳輸到網絡卡,避免了傳統網路棧的處理開銷,從而實現了極低的傳輸延遲和降低的CPU負載。 同時,它可以部署在現有的乙太網基礎設施上,而無需額外的專用網路裝置或光纖佈線。 在具體時延方面,基於25G網絡卡,ROCE在網路傳輸時延方面比TCP好幾倍到幾十倍。
與基於專有硬體裝置的傳統儲存系統不同,XGFS分布式寫入快取解決方案XDcache具有以下特點:它可以執行在標準硬體上,並使用不同供應商的硬體裝置,因此不受特定硬體廠商的限制資料複製網路使用 RDMA Rocev2 協議在低成本乙太網上構建低延遲資料傳輸,同時降低 CPU 負載預設的三副本機制使資料在兩個節點同時關閉電源時仍完全可用。
XDCache 是乙個企業級應用程式提供超低延遲和可靠性
多級快取架構
在 v5 版本中,閘道器層快取技術 xcache 為 xgfs 提供了多種快取策略,以加速檔案讀取效能。 (請參閱:)。
提供檔案預讀能力,提前識別檔案順序讀IO並非同步載入到快取中,實現高命中率。 適用於高頻寬場景,如廣播電視非編輯、基因測序等提供對目錄進行預取的能力,以識別並提前將一批小檔案載入到快取中,以便載入目錄中的大量小檔案。 適用於醫學影像、AI訓練等小檔案場景為元資料和目錄提供快取功能。 預設情況下,它可以對數千萬個元資料進行加速。 適用於所有場景;
XGFS支援協議伺服器、閘道器、元資料集群、儲存池等多級快取技術,滿足各種檔案服務模式的訪問加速。
XCache 在節點內提供協議讀快取機制,在客戶端事務級別提供臨時快取能力,使客戶端請求盡可能在協議閘道器中完成元資料檢索,提供節點間的寫快取,提供跨節點的快取一致性,確保不同檔案網關節點的檢視一致XSspeed Storage Pool 是 XSKY SDS 提供的新一代全域性快取技術,通過聚合所有節點的快取介質來提供高效能的 IO,同時提供高價效比的 EC+ 壓縮能力和更好的空間利用率。
xgfs 6.版本 3 創新性地使用了 XDCACHE(XGFS 分布式快取),這是一種高度冗餘的快取技術,結合了多副本記憶體和非同步 SSD 寫入該產品不僅實現了基於通用硬體的高效能快取,為企業級應用提供了超低延遲的訪問,還保證了快取資料的高可靠性。
關鍵技術:
自研檔案元資料集群(XMDS)集群的優勢:
將閘道器層快取功能融合到元資料群集 (XMDS)。 合併資料和元資料兩條路徑,為協議OP優化提供更多空間多路復用元資料集群(XMDS)具有成熟的多副本和故障恢復功能,基於通用RAM實現多副本記憶體,並持久化WAL(write-ahead logging)以保證資料安全RDMA Rocev2 網路協議支援:使用通用網絡卡,大大降低小檔案場景下的內部 IO 延遲
智慧型回刷:將低併發轉換為高併發,將不對齊向下刷,提高小型IO的整體吞吐量。
智慧型IO過濾:自動識別高併發的大型IO,直接寫入儲存池,提公升快取模組效率。
xdcache 主要用於提高小檔案和小 IO 寫入的效能直寫跟寫回兩種策略:
直寫策略:適用於企業級應用,如醫學影像、雲桌面共享、CAD CAE工程設計、質檢機直存、基因比對、EDA設計等寫回策略:適用於批量流式寫入和 AI 訓練場景。
多場景驗證XDCACHE 效果
xdcache 位於 6在版本 3 中正式發布,在最後 6 個版本版本2已經灰度上線,並在多個領域進行了驗證,效能得到了很大的提公升,得到了客戶的認可。
在西北某三甲醫院,在替代國外分布式NAS廠商的專案中,XGFS在上傳效能方面領先國外競爭對手20%,讀取效能提公升170%。
由於 PACS 系統按患者、日期、型別等對影象資料進行排序和存檔,因此在讀取膠片時通常會將所有小檔案載入到乙個子資料夾中。 得益於 XGFS 的目錄預取機制,當檢測到這種讀取行為時,會提前將一批 ** 檔案預載入到快取中,後續的讀取會命中快取,從而減少讀取訪問的等待時間,提高醫療工作的效率和準確性。
在某鐵路設計單元群雲建設中,引入XGFS SMB共享作為所有雲桌面的通用網盤資源,並承擔了所有非結構化資料及相關專業CAD CAE軟體工程檔案的儲存工作。 疫情期間,該儲存同時支援3000多個桌面業務訪問連線,使企業員工能夠順利在家工作。 新版本,以編寫為主要IO模型的工程設計軟體,效能提公升80%至200%,效率大幅提公升。
使用測試工具VDBont模擬真實機器生成的4 KB、64 KB、128 KB、200 KB、1 MB和2 MB檔案(不同比例)的4 KB IO效能,驗證了混合讀/寫模式下的IO效能。 測試結果顯示xgfs新版小檔案運維比國產I廠商提公升44%,比S廠商提公升16%,效能領先
總結
與塊儲存和物件儲存不同,檔案系統符合POSIX標準,實際應用交付給儲存的工作負載非常複雜。 XSKY通過軟體定義儲存技術,在檔案的典型場景應用上投入了大量研究無需NVRAM等特殊硬體支援,基於通用硬體為企業應用提供低成本、高匹配度的檔案寫入快取解決方案,大幅提公升檔案寫入效能,滿足使用者對企業級高效能檔案的需求