
【導語】為落實國家五部委相關實施意見,中國移動在國家數據局指導下,積極參與全國一體化算力網建設。通過算力並網打破算力孤島、以智能算力池化實現資源高效管理,並主導編寫相關技術文件助力標準構建。本文將聚焦算力並網與池化兩大方向,解讀中國移動如何為全國一體化算力網高效建設賦能。

為落實國家五部委《關於深入實施“東數西算”工程 加快構建全國一體化算力網的實施意見》,中國移動在國家數據局指導下,全麵參與全國一體化算力網監測調度先行先試工作。基於算力網絡科學裝置CFITI(CFN Innovative Test Infrastructure)的算力原生跨架構遷移和算網大腦能力實現全國一體化算力網監測調度平(píng)台(tái)的(de)跨(kuà)主體(tǐ)、跨(kuà)區(qū)域、跨(kuà)架(jià)構(gòu)算(suàn)力(lì)並(bìng)網(wǎng)和(hé)異(yì)構(gòu)算(suàn)力(lì)池(chí)化(huà),推(tuī)動(dòng)構(gòu)建(jiàn)全國(guó)算(suàn)力(lì)“一(yī)張(zhāng)網(wǎng)”、“一(yī)盤(pán)棋(qí)”。同(tóng)時(shí),積(jī)極(jí)參(cān)與(yǔ)構(gòu)建(jiàn)全國(guó)一(yī)體(tǐ)化(huà)算(suàn)力(lì)網(wǎng)標(biāo)準體係,主導編寫《全國一體化算力網 智能算力池化技術要求》和《全國一體化算力網 算力資源管理與調度技術要求》技術文件,助力實現異構算力資源的全局統籌與智能調度。本文重點解讀如何從算力並網和算力池化兩大核心方向全麵助力全國一體化算力網高效建設。
1、為什麽一體化算力網需要進行算力“並網”和“池化”?
全國一體化算力網作為數字經濟核心基礎設施,旨在通過整合多元異構算力實現資源高效調度、設施綠色低碳、算力靈活供給、服務智能隨需,主要麵臨以下問題和挑戰:
一是“自建水井”太多,資源閑置嚴重: 算力資源建設分散孤立,“小作坊”遍地開花,缺乏統一調度。一邊是算力饑渴的AI大模型嗷嗷待哺,另一邊卻是大量算力設備閑置“曬太陽”,整體利用率亟待提升。
二是“度量衡”不統一,難以互通: 不同廠商的芯片(CPU、GPU、AI加速卡等),如同說著不同方言、使用不同貨幣。缺乏統一“度量衡”,導致異構算力資源難以抽象建模形成統一的共享資源池,無法高效整合和統一調用。
三是“技術小圈子”林立,各自為政: 不同硬件廠商構築技術“護城河”,軟硬件深度捆綁。應用想跨平台?難如登天!結果就是“小圈子”生態多而不強,用戶被鎖定,創新被束縛。
四是“遷移成本”高昂,國產化遇冷: 應用想換個“國產芯”?移植難度大、成本高,開發者望而卻步,“小圈子”生態難以突破壯大。
2、打通算力孤島,實現智算資源池化
為解決上述算力利用率低、異構算力統一度量、調度難,跨架構遷移難的問題,全國一體化算力網重點從算力並網和智能算力池化兩方麵破局:
一方麵通過算力並網打破算力孤島,廣泛接入樞紐節點和社會算力,通過網絡連接實現異屬異構異地的算力資源高效匯聚。通過製定開放統一API接口將分散在各地的算力中心(無論國家樞紐節點還是社會企業自建算力)通過高速網絡連接起來, 實現異屬(不同所有者)、異構(不同芯片架構)、異地(不同地理位置) 算力資源的可達和可用,推動算力資源便捷接入全國一體化算力網,破解算力孤島困局,為廣泛調度奠定基礎。
另一方麵通過算力池化對匯入的五花八門算力資源進行“抽象”和“虛擬化”管理,形成統一、透明的“算力池”。通過先進的虛擬化、資源調度和抽象建模技術,一是屏蔽異構差異, 如同一個“萬能翻譯官”和“統一度量衡”,將不同芯片的性能、能力轉化為標準化的“算力單元”;二是資源池化管理,將物理上分散的算力,在邏輯上聚合成一個巨大的、可靈活切分的資源池;三是解耦硬件與應用,讓應用開發者無需關注底層芯片異構性,大幅降低開發複雜度和運維成本,支撐全國一體算力網實現資源按需分配,動態調度和應用自由遷移,讓算力服務像水電一樣便捷取用。
3、中國移動以算力並網築基,以算力原生“芯合”平台賦能全國一體化算力網
在算力並網方麵,中國移動基於算力網絡試驗網CFITI共性開放創新環境,創新提出並驗證三種算力並網技術模式,聯動產、學、研、政推進超算並網、跨域並網調度等前沿技術驗證,依托協同創新基地,聯合新華三、曙光、浪潮、華為、亞信等合作夥伴創建算網協同服務子實驗室,形成1+N合作生態,實現中國移動百川並網平台商用落地,當前中國移動已並網匯聚21家智算中心、3家國家級超算中心、3家量子計算中心算力資源。
在智能算力池化方麵,中國移動已布局異構超融合技術體係-算力原生,攻克統一算力抽象、統一編程模型、跨架構遷移編譯優化、自適應運行、XPU算力資源統一調度及納管等關鍵技術,形成算力抽象、統一編程範式等係列標準,研發業內首個“芯合”異構超融合基礎軟件棧,當前已實現多樣異構算力資源的統一適配及納管和泛(fàn)AI應(yīng)用(yòng)跨(kuà)7家(jiā)芯(xīn)片(piàn)廠(chǎng)商(shāng)的(de)一(yī)鍵式(shì)遷(qiān)移(yí)部(bù)署(shǔ),為(wèi)支(zhī)撐(chēng)實(shí)現(xiàn)全國(guó)一(yī)體(tǐ)化(huà)算(suàn)力(lì)網(wǎng)提(tí)供(gōng)了(le)有(yǒu)力(lì)支(zhī)撐(chēng)。
未(wèi)來(lái)中(zhōng)國(guó)移(yí)動(dòng)將(jiāng)加(jiā)速(sù)推(tuī)動(dòng)算(suàn)力(lì)並(bìng)網(wǎng)和(hé)算(suàn)力(lì)池(chí)化(huà)多(duō)路徑示範驗證和產業化規模應用,同時加大標準及開源投入,促進形成產業共識,全方位支撐全國一體化算力網建設和“東數西算”工程深入實施。
作者:曹廣靜、王羽琪、張婷婷
單位:中國移動研究院
AI校園體育抖音號
AI校園體育視頻號
AI城市更新抖音號
AI城市更新視頻號
微信公眾號