4月26日,由上海市經濟和信息化發展研究中心、上海市網絡算力協會共同主辦的“2024長三角算力基礎設施建設論壇”在上海成功舉辦。論壇匯聚了來自主管部門的領導及權威專家,圍繞“算力引領 產業創新”為主題,聚焦計算力、運載力、存儲力以及應用賦能做數字經濟、實體經濟落地實施進行探討。會上,華為數字能源上海總經理石憶應邀發表主題演講——“讓數字世界堅定運行 共贏智算未來”并受到現場領導及專家的廣泛關注和好評。 華為數字能源上海總經理石憶 智能世界加速到來,算力驅動數據中心迎來高速增長 石憶在演講中提到,隨著人工智能進入千行百業,智慧物流、智能制造、智能客服等應用場景相繼涌現,目前人工智能正迭代式跨越發展,加快通用人工智能時代的到來。伴隨而來的是算力需求的爆發,據有關數據顯示,預計2020至2030年這10年間,通用算力將增長10倍,AI算力將增長500倍,預計到2030年,算力基礎設施市場空間將達5000億美元。 面對巨大的市場,智算建設也面臨諸多的挑戰,在石憶看來,主要面對的挑戰有以下4點: ?? 更多的資源消耗:根據報告預測2018年至2025年間,GPU功耗將從250W增加至1400W,增大5.5倍,單柜功率將從5KW增加至50KW增長10倍;全國數據中心耗電量將由社會總耗電量的1.6增長至6。 ???更快的上線速度:一般大型智算中心建設周期要在12個月,但高速的算力需求增長迫使智算中心的建設周期縮短至6~9個月。 ???更高的運維難度:2018年至2023年間,專業運維人員缺口由38增大至53,除智算中心的建設高速增長外,智算中心運維系統的增多也是造成人員缺口的原因之一。 ???更大的安全挑戰:以盤古大模型checkpoint 4h為例, 中斷一次的損失將超過41萬元,一旦宕機超過100萬美元,損失比例也由2019年的11增長至2023年的25。 智算時代下,綠色跟安全是下一代智算中心的兩大特性 石憶看來,下一代智算中心從建設到運維全流程要符合“綠色”與“安全”兩大特性。 綠色方面要從“極簡”出發,符合供電極簡、溫控極簡、能效自優三個方面。 ???供電極簡:依托華為的根技術與架構的極簡,通過撲翼式開關,1柜4開關實現部件融合, 10千伏到380伏的供電輸出下,從22柜壓縮至11柜,節省40空間;此外,在開啟S-ECO的模式下,鏈路效率最高可達97.8,實現從簡單的物理連接走向融合供電,實現省地、省電。 ???溫控極簡:華為間接蒸發冷卻EHU方案,最大化利用自然風冷卻的冷鏈極簡,自研高效風機,提升制冷CLF 35;華為自研高分子換熱芯,相比冷凍水可降低用水量57,從而實現節能、節水。 ???能效自優:通過一次部署,AI自學習,實時調優,可實現制冷耗電量下降8~15,年電費節省約500萬(場景模型為 1500柜@北京,8kW/柜,2N,50負載,改造前運行PUE 電費0.75元/kWh,機柜租金7360元/月,年省電費300-600萬CNY)。 通過“極簡”的架構,客戶可以獲得更快的建設速度,滿足快速上線的需求,在智算時代的大背景下,快人一步,搶得市場先機。 而在安全方面,則要從主動安全、運維安全、架構安全三個層面,全方位構筑數據中心基礎設施安全防線。 ???主動安全:通過AI的預測性算法,變“被動告警”為“主動AI預測性維護”(如風扇及電容壽命預測,銅排溫度檢測,提升可靠性),極大降低故障率,防患于未然。同時借助AI的能力,一旦發生故障,將傳統的人工響應改為自動響應,做到1分鐘發現,3分鐘分析,5分鐘恢復,降低故障所造成的影響。 ???架構安全:結合華為在電子電力技術及ICT技術的耕耘,采用模塊化架構設計,通過部件級的熱插拔,設備級的全冗余,做到系統級99.999的高可用性。 ???運維安全:在日常運維中充分利用人工智能技術,結合智能傳感/IoT/聲音識別/圖像識別等技術,將傳統人工巡檢模式向AI遠程巡檢模式轉變,降低對運維人員的專業性要求。 融合數字技術和電力電子技術,共建綠色美好未來 華為數字能源以融合數字技術和電力電子技術,發展清潔能源與能源數字化,推動能源革命,共建綠色美好未來為愿景。將充分發揮世界領先的根技術體系與端到端的研發體系,構筑世界領先、穩健安全的技術生態體系;其次,將發揮數字技術與電力電子技術融合優勢,創造行業獨特價值;其三,通過全棧式解決方案,融會貫通L1-L3更加高效;其四,通過的市場體系、生態體系、管理體系、企業文化,賦能客戶、伙伴以及產業,帶來更多的價值。 |