杭州2026年5月28日 /美通社/ -- 當前,AI大模型已達到萬億級參數、百萬Token(詞元)上下文長度的規模,且規模仍在持續提升。智算中心已進入"系統效率競爭"階段,為滿足AI大模型訓練和推理需求,GPU集群要實現高效運行,必須依托算力、網絡、存儲、調度和運維的整體協同。其中,存儲系統正從傳統的數據承載平臺,升級為影響GPU利用率、訓練效率和業務連續性的關鍵基礎設施。
面對海量訓練數據、高并發訪問、Checkpoint快速讀寫、冷熱數據混合管理等需求,云尖信息推出了高性能、高可靠、可擴展的分布式存儲解決方案。
云尖信息分布式存儲解決方案
云尖信息分布式存儲解決方案,采用"高性能全閃層 + 大容量混閃層 + 高速無損網絡 + 分布式并行文件系統 + 多協議統一訪問"的架構設計,以CS8000 X6與CS6000 X6雙產品協同,構建分層數據底座,充分適配大模型訓推場景和高性能計算場景,成為智算中心建設的優選方案。
雙產品協同,CS8000+CS6000構建分層數據底座
在分層架構中,CS8000 X6面向高性能數據訪問需求,單節點順序讀帶寬可達40GB/s;在典型小文件測試場景下,IOPS可達400K+。其作為全閃加速層,主要承載大模型訓練熱數據集、Checkpoint高頻讀寫、模型加載與分發、高并發文件訪問、低時延數據訪問等需求。
CS6000 X6面向海量數據承載需求,支持大規模橫向擴展,單文件系統容量可達200PB以上。其作為混閃容量層,主要承載海量非結構化數據、冷熱混合數據集、全量訓練數據與歷史數據、日志歸檔備份、視頻圖像文檔等大容量文件及中長期數據生命周期管理等需求。
兩者協同形成"高性能訪問+大容量承載"的分布式存儲體系, 滿足AI 訓練、集群推理與HPC場景下的數據訪問和長期管理需求。
從技術能力到業務收益,全維度解決行業痛點
基于上述架構,云尖信息分布式存儲解決方案從性能釋放、數據保護、彈性擴展、協議兼容、平滑遷移與智能管理等維度,支撐 AI 訓練、集群推理與 HPC 場景中的多樣化數據訪問需求。
1、高性能并行訪問,提升GPU集群利用率
AI訓練、HPC仿真、多模態數據處理對高吞吐、低時延和高并發訪問要求較高,方案通過高性能分布式并行存儲與高速網絡協同,降低大規模并發訪問場景下容易出現 I/O 瓶頸的問題,減少 GPU 等待數據的時間,讓算力資源得到更充分釋放。
2、分層數據承載,優化存儲成本與數據分層管理
面對訓練數據、模型文件、Checkpoint、中間結果、日志和歸檔數據的持續增長,方案通過CS8000全閃高性能層與CS6000混閃容量層協同,將高頻熱數據與低頻冷數據分層承載,在保障性能的同時降低全量全閃帶來的成本壓力。
3、多協議統一訪問,減少數據孤島與遷移復雜度
方案通過多協議兼容和統一數據訪問能力,適配AI、HPC、大數據和通用業務環境,減少多套存儲系統并存帶來的數據重復、遷移復雜和管理割裂,有效降低數據遷移成本。
4、分布式高可靠架構,支撐業務連續與彈性擴展
智算中心從幾十卡、百卡向千卡、萬卡演進,存儲不僅要擴容量,還要同步擴性能。方案通過多副本、糾刪碼、快照、遠程復制、故障自動修復與橫向擴展能力,保障硬盤、節點及網絡故障下的業務連續運行,并支撐智算中心后續規模擴展。
以高效數據底座支撐新一代智算中心
在智算中心建設中,算力決定上限,存儲決定效率,網絡決定協同。云尖信息分布式存儲解決方案以CS8000 X6和CS6000 X6為核心,構建覆蓋高性能熱數據訪問與大容量數據管理的分層存儲體系,為AI訓練、集群推理、HPC 和海量非結構化數據處理提供穩定支撐。
未來,云尖信息將持續完善面向 AIDC 智算中心的服務器、存儲、網絡、液冷和運維服務能力,以高效、可靠、可擴展的數據底座,支撐客戶智算基礎設施建設與業務持續演進。