央企“AI+”行動(dòng)觀察之筑牢智算底座:算力筑基,智啟新篇 時(shí)間: 2025-04-28 22:01:29
【前言】算力是人工智能產(chǎn)業(yè)的“金字塔”體系中的基石,為大模型訓(xùn)練、數(shù)據(jù)處理以及場(chǎng)景應(yīng)用的蓬勃發(fā)展提供著有力支撐。央企“AI+”專項(xiàng)行動(dòng)推進(jìn)以來(lái),以通信、能源、科技類央企為代表,正通過(guò)算力基礎(chǔ)設(shè)施建設(shè)、算力國(guó)產(chǎn)化、算力資源調(diào)度等多維布局,構(gòu)建起自主可控的算力網(wǎng)絡(luò),為我國(guó)AI產(chǎn)業(yè)發(fā)展注入澎湃動(dòng)能。
工信部數(shù)據(jù)顯示,截至2024年底,我國(guó)算力總規(guī)模達(dá)280EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算,以FP32單精度計(jì)算),其中智能算力規(guī)模達(dá)90EFLOPS(FP32),占比達(dá)32%。
算力需求的爆發(fā)式增長(zhǎng),催生了央企對(duì)智算集群的規(guī)模化布局。從規(guī)模上看,我國(guó)算力總規(guī)模已位居全球第二,而通信行業(yè)央企成為算力供給的“主力軍”。
近年來(lái),中央企業(yè)主動(dòng)融入國(guó)家算力布局,加大算力資源投入力度。從算力布局上看,既有滿足大模型集中訓(xùn)練需求的大規(guī)模智算集群,也有滿足推理算力需求的邊緣節(jié)點(diǎn)。例如,中國(guó)電信基本形成“2+3+7+X”智算布局,兩大公共智算中心輻射全國(guó),三大熱點(diǎn)區(qū)域滿足超大規(guī)模集群需求;中國(guó)聯(lián)通加快推進(jìn)數(shù)據(jù)中心向智算中心升級(jí),建成300多個(gè)訓(xùn)推一體的算力資源池;中國(guó)移動(dòng)建成了2個(gè)超萬(wàn)卡智算中心、13個(gè)區(qū)域智算中心及1500個(gè)邊緣節(jié)點(diǎn)。截至2024年底,中國(guó)移動(dòng)智算中心算力規(guī)模達(dá)29.2EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算),相當(dāng)于146萬(wàn)臺(tái)普通計(jì)算機(jī)的計(jì)算能力總和。
從技術(shù)能力看,我國(guó)萬(wàn)卡集群的設(shè)計(jì)建設(shè)能力實(shí)現(xiàn)新突破。萬(wàn)卡集群是指由一萬(wàn)張及以上的加速卡(如GPU、TPU或其他專用AI加速芯片)組成的高性能計(jì)算系統(tǒng),用以訓(xùn)練基礎(chǔ)大模型。中國(guó)電信于2024年3月在國(guó)內(nèi)率先推出國(guó)產(chǎn)單池萬(wàn)卡液冷算力集群,標(biāo)志著我國(guó)在算力基礎(chǔ)設(shè)施建設(shè)領(lǐng)域?qū)崿F(xiàn)了新的突破。此外,中國(guó)電信“息壤”智算平臺(tái)整合自有及合作伙伴算力,形成62EFLOPS的“算力池”,可同時(shí)支撐超10萬(wàn)個(gè)AI任務(wù)并行運(yùn)行。以中國(guó)電信臨港智算中心為例,其創(chuàng)新性地采用網(wǎng)絡(luò)中置、算力分層的“魔方”型布局,巧妙繞過(guò)IB網(wǎng)絡(luò)50米傳輸?shù)木窒蓿瑢?shí)現(xiàn)了單一集群內(nèi)萬(wàn)卡高速互聯(lián)。
這些超級(jí)算力集群如同“智能能源樞紐”,為大模型訓(xùn)練提供底層支撐——國(guó)家電網(wǎng)“光明電力大模型”訓(xùn)練中,智能算力集群自動(dòng)識(shí)別訓(xùn)練各階段的算力需求差異,在數(shù)據(jù)預(yù)處理階段優(yōu)先分配CPU資源,將訓(xùn)練周期從傳統(tǒng)架構(gòu)的3個(gè)月壓縮至18天,算力成本降低45%。再如,在能源領(lǐng)域,央企探索出“算力+綠電”的特色路徑。國(guó)家電投在內(nèi)蒙古建設(shè)的“零碳智算中心”,采用光伏直供電技術(shù),年消納綠電超5000萬(wàn)度,算力成本較傳統(tǒng)數(shù)據(jù)中心降低 35%。這種“綠電養(yǎng)算力”模式,既滿足了AI產(chǎn)業(yè)高耗能需求,又為“雙碳”目標(biāo)貢獻(xiàn)央企方案,被工信部列為綠色算力典型案例。
算力國(guó)產(chǎn)化是國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展的趨勢(shì),近年來(lái)我國(guó)算力國(guó)產(chǎn)化取得顯著突破。京津冀智能算力中心建成了京津冀地區(qū)唯一國(guó)產(chǎn)液冷單集群萬(wàn)卡智算資源池,成為業(yè)內(nèi)領(lǐng)先的全國(guó)產(chǎn)化訓(xùn)推一體、國(guó)產(chǎn)自研架構(gòu)的高性能公共智算中心。
在算力核心技術(shù)領(lǐng)域,央企展開(kāi)自主攻關(guān),破解關(guān)鍵環(huán)節(jié)依賴進(jìn)口的困局。芯片方面,中國(guó)電子旗下華大電子研發(fā)的“華睿2 號(hào)”AI 芯片,采用存算一體架構(gòu),算力密度達(dá)256TOPS(每秒萬(wàn)億次運(yùn)算),功耗僅為傳統(tǒng)GPU的1/3,已在電網(wǎng)設(shè)備監(jiān)測(cè)場(chǎng)景實(shí)現(xiàn)規(guī)模化應(yīng)用。華為昇騰910B芯片在電力、制造等場(chǎng)景推理性能達(dá)到國(guó)際主流產(chǎn)品的90%,已支撐國(guó)家電網(wǎng)AI調(diào)度系統(tǒng)實(shí)現(xiàn)全網(wǎng)負(fù)荷預(yù)測(cè)誤差率低于1.5%,中石油勘探模型訓(xùn)練效率提升40%。
在算力架構(gòu)創(chuàng)新方面,航天科工行云科技推出的“天智”異構(gòu)計(jì)算平臺(tái),兼容國(guó)產(chǎn)芯片與開(kāi)源框架,使大模型訓(xùn)練成本降低 50%,被列入國(guó)資委自主創(chuàng)新產(chǎn)品目錄。國(guó)家電網(wǎng)聯(lián)合中科院計(jì)算所研發(fā)的“電力行業(yè)專屬算力中臺(tái)”,針對(duì)電網(wǎng)數(shù)據(jù)高實(shí)時(shí)性、高安全性需求,設(shè)計(jì)出“流計(jì)算+圖計(jì)算”融合架構(gòu),可同時(shí)處理百萬(wàn)級(jí)傳感器實(shí)時(shí)數(shù)據(jù),故障識(shí)別時(shí)延小于100毫秒,較通用架構(gòu)性能提升6倍。這種“因需而建”的定制化算力方案,正成為行業(yè)智能化的標(biāo)配。
通過(guò)算力調(diào)度破解資源錯(cuò)配
面對(duì)算力資源分布不均的痛點(diǎn),央企創(chuàng)新算力調(diào)度技術(shù),構(gòu)建“全國(guó)一盤棋”的算力網(wǎng)絡(luò)。為更好統(tǒng)籌、調(diào)度算力資源,中國(guó)電信自研“息壤”平臺(tái),能夠在全國(guó)范圍內(nèi)實(shí)現(xiàn)每分鐘數(shù)萬(wàn)次、每天上千萬(wàn)次的算力統(tǒng)籌調(diào)度,滿足千行百業(yè)對(duì)算力的需求。通過(guò)智能算法實(shí)現(xiàn)跨地域、跨廠商算力資源的動(dòng)態(tài)分配,將GPU利用率從行業(yè)平均的30%提升70%。
為滿足算力數(shù)據(jù)的流通需求,中國(guó)移動(dòng)投用400G全光骨干網(wǎng),編織了一張貫穿30個(gè)省(自治區(qū)、直轄市)及200多個(gè)城市的算力“運(yùn)輸系統(tǒng)”,實(shí)現(xiàn)傳輸帶寬提升4倍、樞紐間時(shí)延均低于20毫秒、關(guān)鍵主用鏈路時(shí)延降幅達(dá)20%、單比特能耗降低65%、單比特成本下降20%。中國(guó)移動(dòng)推出的“九天?海算”算力網(wǎng)絡(luò),更實(shí)現(xiàn)了算力與數(shù)據(jù)的協(xié)同流動(dòng)。在雄安新區(qū)智慧交通項(xiàng)目中,平臺(tái)將路側(cè)傳感器數(shù)據(jù)實(shí)時(shí)推送至邊緣算力節(jié)點(diǎn),完成車流量預(yù)測(cè)、信號(hào)燈優(yōu)化等計(jì)算任務(wù),時(shí)延控制在50毫秒以內(nèi),較傳統(tǒng)集中式架構(gòu)提升3倍效率。此外,中國(guó)移動(dòng)還推出“算網(wǎng)大腦”,實(shí)現(xiàn)通算、智算、超算、量算的統(tǒng)一調(diào)度,推動(dòng)算力成為像水、電一樣,可“一點(diǎn)接入、即取即用”的社會(huì)級(jí)服務(wù)。這種“中心算力+邊緣算力”的分級(jí)調(diào)度體系,正在重塑 AI 應(yīng)用的基礎(chǔ)設(shè)施架構(gòu)。
“從目前態(tài)勢(shì)看,算力基礎(chǔ)設(shè)施依然是人工智能發(fā)展的重要支撐。下一步中央企業(yè)將持續(xù)加快智算資源建設(shè)。”國(guó)務(wù)院國(guó)資委規(guī)劃局負(fù)責(zé)同志說(shuō),三大運(yùn)營(yíng)商要深度參與訓(xùn)練場(chǎng)建設(shè),為訓(xùn)練更加復(fù)雜的AI模型提供算力支撐。
算力是千行百業(yè)智能化轉(zhuǎn)型的“通用工具”。當(dāng)前,央企算力基建已形成“算力規(guī)模化、技術(shù)自主化、調(diào)度智能化”的發(fā)展格局。央企正通過(guò)算力基建的智能化升級(jí),為我國(guó)搶占全球AI競(jìng)爭(zhēng)制高點(diǎn)提供最底層的支撐——這既是大國(guó)央企的責(zé)任擔(dān)當(dāng),更是智能時(shí)代的中國(guó)答案。