![]() |
—— IBM 大中華區(qū)技術服務部總經(jīng)理潘軍
北京2026年4月10日 /美通社/ -- AI 正快速融入企業(yè)關鍵業(yè)務領域,但支撐其落地運行的 IT 體系尚未完全做好準備。IBM 調研數(shù)據(jù)顯示,77%的受訪高管希望加快 AI 應用落地節(jié)奏,而僅有25%認為現(xiàn)有 IT 基礎設施能夠支撐 AI 的規(guī)?;涞?。
這一"就緒度缺口"表明,AI 帶來的變革并非單一技術升級,而是對企業(yè)整體 IT體系的系統(tǒng)性重構。在 IBM 技術服務部看來,AI 正在融入企業(yè)運營模型,推動 IT 運維從傳統(tǒng)后端支持職能,向支撐業(yè)務創(chuàng)新的關鍵能力演進。
運維模式重構:從響應式腳本進化為智能體驅動的運維
長期以來,企業(yè) IT 運維以"故障響應"為核心。隨著企業(yè) IT 系統(tǒng)復雜度持續(xù)攀升,運維模式正從傳統(tǒng)自動化腳本向"自主智能體 AI(Agentic AI)"演進。
這一轉變的核心在于運維邏輯的升級:基于 IBM watsonx 平臺,AI 不再僅執(zhí)行預設規(guī)則,而是具備一定的自主推理能力,能夠拆解業(yè)務目標并規(guī)劃端到端運維任務的執(zhí)行路徑。通過多智能體協(xié)同,企業(yè)運維體系可實現(xiàn)從狀態(tài)感知到?jīng)Q策執(zhí)行的閉環(huán)管理。在部分場景下,系統(tǒng)可自主完成根因分析并實現(xiàn)故障自愈,平均修復時間可縮短最高 80%。
目前,基于 IBM TLS Support Insights 平臺,公司已在全球為超過 3000 家客戶管理超過 400 萬個 IT 資產(chǎn)。在 IBM 相關實踐中,91%的 Call Home 設備告警請求已實現(xiàn)自動化響應和處置,從而緩解運維壓力并提升系統(tǒng)穩(wěn)定性。
技術底座演進:應對 AI 規(guī)?;A設施約束
AI 規(guī)模化落地對基礎設施提出系統(tǒng)性挑戰(zhàn),其算力、運力與存力的協(xié)同表現(xiàn),以及安全與混合云架構設計,直接影響基礎設施對業(yè)務目標的支撐能力。
作為支撐算力集群效能的關鍵基礎設施,IDC 報告指出,在生成式 AI 訓練場景中,網(wǎng)絡投入已占基礎設施總成本的約 44%。在運力層面,AI 工作負載高度依賴海量"東西向流量"以及 GPU 間穩(wěn)定的低延遲通信,訓練、推理、微調等核心場景對帶寬需求呈指數(shù)級增長,網(wǎng)絡接口正從 400G、800G 向更高速率演進。以千卡級 GPU 集群為例,計算網(wǎng)絡與管理網(wǎng)絡的疊加導致單個集群的線路規(guī)模激增(高達數(shù)千條),迫使布線方式從傳統(tǒng)直接跳線向更易于維護的結構化布線轉型。
在存力層面,大模型應用對數(shù)據(jù)吞吐、訪問延遲與帶寬穩(wěn)定性提出了更高要求。為支撐海量運維數(shù)據(jù)的實時處理與模型分析,企業(yè)正在探索存算分離與存算協(xié)同相結合的架構模式。在此過程中,NVMe over Fabric 等高速存儲網(wǎng)絡技術,可在一定程度上提升遠程數(shù)據(jù)訪問效率。在實際落地中,仍需結合本地高速存儲與數(shù)據(jù)分層策略,以降低對網(wǎng)絡路徑的依賴。整體來看,面向 AI 負載的存儲體系正呈現(xiàn)出熱數(shù)據(jù)全閃化、分層存儲與高帶寬互聯(lián)協(xié)同演進的趨勢,從而緩解"算力等待數(shù)據(jù)"的問題,支撐 AI 運維場景的高效運行。
此外,在算力效能層面,面對能耗壓力,企業(yè)需要通過 AI 驅動的容量規(guī)劃與動態(tài)資源調度,精細化調節(jié) NPU/GPU 服務器功耗并優(yōu)化負載分布。在特定優(yōu)化場景中,資源利用率可由約 65%提升至約 89%,在滿足業(yè)務峰值需求的同時提升整體算力效率。
在電力方面,智能風控、智能客服等大規(guī)模 AI 應用落地,對算力需求持續(xù)攀升,但傳統(tǒng)數(shù)據(jù)中心在供電密度與部署周期上難以適配 AI 發(fā)展節(jié)奏。高性能 GPU 集群,推動單機柜功率從傳統(tǒng)的 5–10 千瓦快速提升至 30 千瓦以上,甚至在高密度部署場景中達到更高水平,使得大規(guī)模部署面臨供電與散熱改造的現(xiàn)實約束。同時,能耗成本持續(xù)上升,疊加電力資源與 PUE 優(yōu)化壓力,進一步加劇數(shù)據(jù)中心的運營負擔。
人機協(xié)同:以業(yè)務洞察引導 AI 增強,而非替代
在轉型過程中,IBM 強調 AI 的核心價值在于增強專業(yè)能力,而非簡單替代人力。AI 擅長處理海量數(shù)據(jù)與重復性任務,而人類專家的核心價值在于對業(yè)務場景的理解與決策能力。
調研顯示,64%的 CEO 認為,AI 的成功更依賴人的采納,而非技術本身,這反映出組織與流程因素在 AI 落地過程中的關鍵作用。在實際落地中,這通常體現(xiàn)為將 AI 能力嵌入一線工作流程。例如,在 IBM 內(nèi)部"零號客戶(Client Zero)"實踐中,通過坐席助手(Agent Assist)提供實時建議,初級工程師可借助 AI 完成專家級任務,在緩解技能短缺的同時,將問題解決時間縮短約32%。
這一協(xié)作模式的關鍵在于"釋放與重塑":AI 減少重復性勞動,使運維人員從"救火式"工作中轉向更具業(yè)務價值的領域。企業(yè)轉型效果在很大程度上取決于員工技能升級與人機協(xié)同能力的提升。
以全生命周期方法構建"AI 就緒"的 IT 體系
企業(yè)需從局部單點優(yōu)化轉向體系化的"集成數(shù)據(jù)中心(Integrated Data Center)"建設。這不僅是技術堆棧的升級,更是基于"AI 優(yōu)先(AI-First)"理念對 IT 體系的整體重塑,覆蓋基礎設施規(guī)劃設計、部署實施、運維優(yōu)化以及汰新下線的全生命周期管理。
在基礎設施層面,企業(yè)可通過 AI 驅動的容量規(guī)劃,精準匹配算力、網(wǎng)絡和存儲需求,從而降低資源浪費和總體擁有成本。在運行階段,AI 驅動的預防性維護可在部分場景下提前約 7 至 24 小時預測硬件瓶頸或潛在故障,實現(xiàn)從事后響應向事前預防的轉變。在安全與合規(guī)層面,推進"安全左移"策略,在規(guī)劃初期即引入自動化治理機制。
IBM Support Insights(ISI)可對全球超過 400 萬個資產(chǎn)及 150 萬個活躍漏洞進行實時監(jiān)測,使運維視野從單一可用性擴展至全生命周期的合規(guī)與安全管理,從而在受控環(huán)境下充分釋放 AI 算力價值。
運維能力成為企業(yè)長期競爭力的重要組成部分
總體來看,AI 正在推動企業(yè) IT 體系持續(xù)演進。運維能力不再只是保障系統(tǒng)運行的支持職能,而正逐步成為企業(yè)數(shù)字化能力的重要組成部分。數(shù)據(jù)中心運維要求對基礎設施故障進行快速發(fā)現(xiàn)與快速解決,避免引起大規(guī)模應用系統(tǒng)異常。
構建"1-5-10"安全可控智能閉環(huán),面對 AI 負載帶來的系統(tǒng)復雜性,運維體系正致力于實現(xiàn)"1 分鐘感知異常、5 分鐘定位根因、10 分鐘閉環(huán)修復"的目標。通過 AI 智能體與標準化協(xié)議(如 MCP 等)實時感知系統(tǒng)狀態(tài),系統(tǒng)能夠利用上下文推理迅速收斂根因;隨后調用預設的"授權動作庫"(Skill),在安全權限內(nèi)執(zhí)行自主修復。這一從"分鐘級感知"到"確定性自愈"的跨越,正推動 IT 運維從傳統(tǒng)支持職能向企業(yè)數(shù)字化核心競爭力加速演進。
在這一過程中,IBM 技術服務部作為全生命周期合作伙伴,致力于將 AI 能力與業(yè)務洞察結合,幫助客戶構建具備故障自愈、資源優(yōu)化與成本可控能力的智能運維體系,將 IT 資產(chǎn)轉化為可持續(xù)的競爭優(yōu)勢。未來企業(yè) IT 的關鍵能力,不僅在于系統(tǒng)的穩(wěn)定運行,更在于使系統(tǒng)具備被 AI 理解、調度與持續(xù)優(yōu)化的能力。
參考信息:
https://www.ibm.com/think/topics/ai-for-it-support
https://www.ibm.com/new/product-blog/technology-lifecycle-services-envisioning-the-next-generation-of-support-with-ai
https://www.ibm.com/cn-zh/new/product-blog/new-idc-report-how-ai-is-reshaping-enterprise-networks
https://www.ciscolive.com/c/dam/r/ciscolive/emea/docs/2025/pdf/PARAI-1323.pdf
媒體聯(lián)絡人
李波
libole@cn.ibm.com
IBM中國