北京2026年4月13日 /美通社/ -- 亞馬遜云科技宣布推出Amazon S3 Files,這是一款全新的文件系統(tǒng),能夠?qū)⑷魏蝸嗰R遜云科技計算資源與Amazon Simple Storage Service(Amazon S3)無縫連接。
隨著Amazon S3 Files的推出,Amazon S3成為了可以提供功能完備、高性能文件系統(tǒng)級訪問能力的云對象存儲服務(wù)。它使存儲桶可以作為文件系統(tǒng)被訪問。這意味著文件系統(tǒng)上數(shù)據(jù)的更改會自動同步至Amazon S3存儲桶中,并可以精細控制同步方式。Amazon S3 Files可以掛載至多個計算資源上,無需復(fù)制即可實現(xiàn)跨集群數(shù)據(jù)共享。
Amazon S3 Files通過消除數(shù)據(jù)孤島、同步復(fù)雜性以及在對象和文件之間的手動數(shù)據(jù)移動,有助于簡化云架構(gòu)。無論企業(yè)是運行已經(jīng)與文件系統(tǒng)配合使用的生產(chǎn)級工具、構(gòu)建依賴于基于文件的Python庫和shell腳本的Agentic AI,還是為機器學(xué)習(xí)訓(xùn)練準備數(shù)據(jù)集,Amazon S3 Files都能讓這類需要交互、共享層級化的工作負載,直接訪問Amazon S3數(shù)據(jù),而無需在Amazon S3的高持久性和成本優(yōu)勢與文件系統(tǒng)的交互功能之間進行取舍。企業(yè)現(xiàn)在可以將Amazon S3作為所有數(shù)據(jù)的統(tǒng)一存儲中心,并從任何亞馬遜云科技計算實例、容器和函數(shù)中直接訪問這些數(shù)據(jù)。
十多年前,在解釋對象存儲和文件系統(tǒng)之間的根本區(qū)別時,一個常用的比喻是將Amazon S3對象比作圖書館里的書(無法只編輯單頁,需要替換整本書),而電腦上的文件則可以逐頁修改。這種通過圖表和隱喻的方式可以幫助客戶理解為什么不同的工作負載需要不同的存儲類型。如今,這兩者之間的界限不再那么分明,使用更加靈活。
過去,用戶往往需要在兩種方案之間做取舍:要么選擇Amazon S3的低成本與高持久性,以及能直接讀取Amazon S3數(shù)據(jù)的各類云服務(wù);要么選擇文件系統(tǒng)的交互能力。此次更新消除了這種取舍難題,使Amazon S3成為企業(yè)所有數(shù)據(jù)的核心樞紐。無論是在運行生產(chǎn)級應(yīng)用、訓(xùn)練機器學(xué)習(xí)模型,還是在構(gòu)建Agentic AI系統(tǒng),企業(yè)都可以從任何亞馬遜云科技計算實例、容器或函數(shù)中進行直接訪問。
用戶可以在各類環(huán)境中,像訪問本地文件系統(tǒng)一樣訪問任何通用存儲桶,包括Amazon Elastic Compute Cloud(Amazon EC2)實例、運行在Amazon Elastic Container Service(Amazon ECS)或Amazon Elastic Kubernetes Service(Amazon EKS)上的容器,或Amazon Lambda函數(shù)。Amazon S3 Files會將Amazon S3對象呈現(xiàn)為文件和目錄,并支持所有的NFSv4.1以上版本的操作,例如創(chuàng)建、讀取、更新和刪除文件。
當通過文件系統(tǒng)處理特定文件和目錄時,相關(guān)的文件元數(shù)據(jù)和內(nèi)容會被放置到文件系統(tǒng)的高性能存儲中。默認情況下,需要低延遲訪問的文件將被存儲在高性能存儲中并由其提供服務(wù)。對于未存儲在高性能存儲上的文件(例如需要大量順序讀取的文件),Amazon S3 Files會自動直接從Amazon S3讀取這些文件,以最大化吞吐性能。對于字節(jié)范圍讀取,則僅傳輸所請求的字節(jié),從而最大限度減少數(shù)據(jù)傳輸量,降低使用成本。
該系統(tǒng)還支持智能預(yù)取功能,以預(yù)測數(shù)據(jù)訪問需求。用戶還可以對存儲在文件系統(tǒng)高性能存儲上的內(nèi)容進行精細化控制。可以決定是加載完整的文件數(shù)據(jù)還是僅加載元數(shù)據(jù),這意味著可以針對特定的訪問模式進行優(yōu)化。
在底層架構(gòu)上,Amazon S3 Files基于Amazon Elastic File System(Amazon EFS)構(gòu)建,并為活躍數(shù)據(jù)提供約1毫秒的低延遲訪問。該文件系統(tǒng)支持多計算資源并發(fā)訪問,并采用NFS close-to-open一致性模型,非常適合需要頻繁修改數(shù)據(jù)的交互式共享場景——無論是通過文件工具協(xié)作的Agentic AI,還是處理數(shù)據(jù)集的機器學(xué)習(xí)訓(xùn)練流水線,它都能輕松應(yīng)對。
關(guān)于如何為工作負載選擇合適的文件服務(wù),亞馬遜云科技提供了多種服務(wù)以滿足不同需求。當需要通過高性能文件系統(tǒng)接口對存儲在Amazon S3中的數(shù)據(jù)進行交互式共享訪問時,Amazon S3 Files的效果最佳。它非常適合需要多個計算資源(無論是生產(chǎn)級應(yīng)用、使用Python庫和CLI工具的Agentic AI agent,還是機器學(xué)習(xí)訓(xùn)練流程)協(xié)同讀取、寫入和修改數(shù)據(jù)的工作負載。用戶可以在計算集群之間獲得共享訪問權(quán)限而無需復(fù)制數(shù)據(jù),同時具有亞毫秒級延遲以及與Amazon S3存儲桶的自動同步功能。
對于從本地NAS環(huán)境遷移上云的工作負載,Amazon FSx則能提供用戶熟悉的功能和兼容性。Amazon FSx也是通過Amazon FSx for Lustre進行HPC高性能計算和GPU集群存儲的理想選擇。當企業(yè)的應(yīng)用需要來自Amazon FSx for NetApp ONTAP、Amazon FSx for OpenZFS或Amazon FSx for Windows File Server的特定文件系統(tǒng)功能時,選擇Amazon FSx則更為合適。
目前,Amazon S3 Files已在所有亞馬遜云科技可用區(qū)可用。更多信息可訪問Amazon S3 Files文檔。