《科技觀察》085:新華三:算力網(wǎng)絡(luò)未來演進(jìn)之路,分布式算網(wǎng)大腦是關(guān)鍵
毫無疑問,今天以云計(jì)算為標(biāo)志的“普惠”算力已經(jīng)得到了非常廣泛的普及,如今的云計(jì)算更像是一個(gè)底座,無論是大數(shù)據(jù)、IoT、區(qū)塊鏈、AI,所有的新興技術(shù)都能夠融入云的底座,并基于云服務(wù)的形態(tài)提供任何一種技術(shù)服務(wù),而在應(yīng)用端則是“萬物皆云”,無論是智慧城市、智慧醫(yī)療、智慧教育、智慧交通,所有服務(wù)于社會民生和企業(yè)的能力都能夠通過云來傳遞,這也推動了整個(gè)社會對算力基礎(chǔ)設(shè)施更大的需求。
也正因此,國家高度重視算力產(chǎn)業(yè)的發(fā)展,為加速推進(jìn)算力布局,國家近期也發(fā)布了多項(xiàng)與算力有關(guān)的國家政策,特別是“東數(shù)西算”工程的啟動,作為一個(gè)覆蓋全國主要經(jīng)濟(jì)區(qū)域、橫跨東西部資源和應(yīng)用的算力網(wǎng)絡(luò)樞紐,“東數(shù)西算”不僅會帶來數(shù)據(jù)、算力跨域流動,同時(shí)也成為了實(shí)現(xiàn)產(chǎn)業(yè)躍升、平衡區(qū)域發(fā)展的重要基礎(chǔ)基礎(chǔ)設(shè)施,可以說加快推進(jìn)算力網(wǎng)絡(luò)建設(shè),已成為全行業(yè)乃至全社會的共識。
但也要看到,目前算力網(wǎng)絡(luò)的發(fā)展仍面臨資源分布不均、算力利用效率較低、算力缺乏有效調(diào)度等挑戰(zhàn),而化解這些挑戰(zhàn),對推動算力網(wǎng)絡(luò)的建設(shè),賦能企業(yè)和產(chǎn)業(yè)打造新服務(wù)、新模式和新業(yè)態(tài),無疑具有重要的戰(zhàn)略意義。

在此背景下,在日前舉辦的2022中國算力大會上,新華三集團(tuán)網(wǎng)絡(luò)產(chǎn)品線規(guī)劃與解決方案部總經(jīng)理汲哲指出:“建立各方認(rèn)可的統(tǒng)一算力評估標(biāo)準(zhǔn)平衡成本、效率和體驗(yàn),構(gòu)建分層分域管理的算網(wǎng)架構(gòu),實(shí)現(xiàn)客戶體驗(yàn)和社會總體效益的平衡,是未來高效調(diào)度管理算力的關(guān)鍵所在?!?/strong>
作為算力網(wǎng)絡(luò)發(fā)展的積極參與者和賦能者,新華三對算力評估體系和算力調(diào)度方法的全新思考與探索,對算力網(wǎng)絡(luò)未來的建設(shè)和演進(jìn)之路,乃至推動算網(wǎng)融合在更廣范圍、更深程度、更高水平上融合創(chuàng)新無疑會起到更多的助推作用,而這背后也體現(xiàn)了新華三在“東數(shù)西算”工程和算力網(wǎng)絡(luò)建設(shè)中,不僅是具有前瞻性的,更是具有全局觀的,其價(jià)值可謂“不止于現(xiàn)在,更關(guān)乎未來”。
算力網(wǎng)絡(luò)建設(shè)的四重挑戰(zhàn)
可以看到,盡管我國算力基礎(chǔ)設(shè)施不斷發(fā)展完善,但是算力水平依然很難滿足數(shù)據(jù)量猛增帶來的巨大算力需求。此外,AI大模型的開發(fā)需要強(qiáng)大的算力支撐,AI技術(shù)為企業(yè)生產(chǎn)提供切實(shí)可用的價(jià)值更需要算力支撐。因此無論是數(shù)據(jù)中心還是人工智能計(jì)算中心,均無法滿足全社會對算力的需求,因此通過算力網(wǎng)絡(luò)實(shí)現(xiàn)網(wǎng)絡(luò)互連、資源共享、協(xié)同調(diào)度將是大勢所趨。
對此,汲哲表示,算力網(wǎng)絡(luò)建設(shè)并不是“一蹴而就”的,特別是目前算力網(wǎng)絡(luò)仍然處在一個(gè)早期的階段,這也導(dǎo)致了其在未來的建設(shè)過程中會面臨著四個(gè)方面的挑戰(zhàn)。

一是,從共享角度看,國家實(shí)施“東數(shù)西算”工程,構(gòu)建全國算力網(wǎng)絡(luò)體系,本質(zhì)上就是希望提高跨區(qū)域的算力調(diào)度水平,因此就算算力網(wǎng)絡(luò)的規(guī)模再小,其依然還是跨區(qū)域的,這就會涉及到一個(gè)如何解決“共享性”的問題。換句話說,未來唯有把長三角、粵港澳大灣區(qū)、京津冀、成渝經(jīng)濟(jì)圈等區(qū)域的算力網(wǎng)絡(luò)實(shí)現(xiàn)互聯(lián)互通,由此構(gòu)建出一個(gè)能夠共享的、全國性的泛在算力網(wǎng)絡(luò),將是算力網(wǎng)絡(luò)建設(shè)中的核心目標(biāo)。
二是,從均衡角度看,由于歷史原因,我國數(shù)據(jù)中心的分布是存在一定程度的“失衡”現(xiàn)象的,具體表現(xiàn)在目前一線城市由于受到能耗指標(biāo)、土地、電力等資源的限制,整體的算力需求處于“供不應(yīng)求”的狀態(tài),但同時(shí)中西部的算力供給卻處于“供大于求”的狀態(tài),而從全國的均衡性考慮,這就需要國家層面去統(tǒng)一調(diào)配,但必須承認(rèn)的是,這種跨區(qū)域的算力調(diào)度水平本身就存在很大的難點(diǎn)。
三是,從安全角度看,無論是“東數(shù)西算”還是還是算力網(wǎng)絡(luò)建設(shè),其核心其實(shí)也是為了解決“數(shù)據(jù)”的跨區(qū)域的存儲和流通問題,但在此過程中,算力網(wǎng)絡(luò)也將產(chǎn)生更多的資產(chǎn)暴露面和更高的連接頻次,遭受攻擊的概率也將大幅增加。如果將算力網(wǎng)絡(luò)比作木桶,那安全就是其底座,沒有底座就無法蓄水。因此,筑牢算力網(wǎng)絡(luò)的網(wǎng)絡(luò)安全體系同樣也“刻不容緩”。
四是,從低碳角度看,隨著全球和中國推進(jìn)“雙碳”戰(zhàn)略,如何降低數(shù)據(jù)中心能耗水平也正變得越來越急迫。以中國市場為例,預(yù)計(jì)2023年數(shù)據(jù)中心能耗將達(dá)到2600億千瓦時(shí),到2030年數(shù)據(jù)中心用電量將突破4000億千瓦時(shí),占全社會用電量的比重將升至3.7%。更為關(guān)鍵的是,目前數(shù)據(jù)中心的整體PUE值依然偏高,平均的PUE值為2.46,遠(yuǎn)遠(yuǎn)達(dá)不到國家規(guī)定的PUE值1.4以下的指標(biāo),因此進(jìn)一步降低數(shù)據(jù)中心能耗水平也就變得至關(guān)重要。
由此可見,在未來算力網(wǎng)絡(luò)的建設(shè)中,如何實(shí)現(xiàn)“共享、均衡、安全和低碳”,如何更好地平衡成本、效率和體驗(yàn)、如何高效地調(diào)度、連通橫跨上千公里的算力基礎(chǔ)設(shè)施,構(gòu)建觸手可及的泛在算力網(wǎng)絡(luò),不僅是趨勢所在,更是迫在眉睫。
構(gòu)建算力評估體系是前提
我們知道,在算力網(wǎng)絡(luò)的建設(shè)中,算網(wǎng)融合無疑也是大勢所趨,因此算網(wǎng)融合不僅需要利用網(wǎng)絡(luò)實(shí)現(xiàn)多種算力的多層次互聯(lián),同時(shí)還需要實(shí)現(xiàn)算力資源的感知、調(diào)度,并根據(jù)用戶需求靈活供給。但與此同時(shí),由于整個(gè)算網(wǎng)融合的產(chǎn)業(yè)規(guī)模龐大且鏈條復(fù)雜交錯(cuò),加之算力網(wǎng)絡(luò)的建設(shè)剛剛起步,缺少標(biāo)準(zhǔn)體系的頂層設(shè)計(jì),因此未來如何打破算力信息互通和實(shí)現(xiàn)智能化調(diào)度,以及盡快構(gòu)建出算力網(wǎng)絡(luò)評價(jià)標(biāo)準(zhǔn)也就變得十分的重要。

在汲哲看來,未來算力網(wǎng)絡(luò)要為百行百業(yè)的用戶提供算網(wǎng)一體化的體驗(yàn),那么大致上會經(jīng)歷以下的流程:即當(dāng)用戶向算力網(wǎng)絡(luò)運(yùn)營方購買算力服務(wù)時(shí),如一次視頻渲染服務(wù),用戶就需要先在運(yùn)營商提供算力網(wǎng)絡(luò)商城中,選擇滿足用戶要求的服務(wù)或者APP,之后算網(wǎng)大腦會根據(jù)SaaS廠商提供的資源需求計(jì)算出這次業(yè)務(wù)需要的云計(jì)算資源,并且在云計(jì)算資源池中找到符合要求的節(jié)點(diǎn),之后會開通應(yīng)用運(yùn)行環(huán)境,并安裝SaaS廠商提供的鏡像,完成之后,算網(wǎng)大腦還會計(jì)算到這個(gè)節(jié)點(diǎn)的最優(yōu)路徑,并下發(fā)到云專網(wǎng)中,并為客戶業(yè)務(wù)提供端到端的應(yīng)用加速、安全加固等功能。而在這一過程中,算網(wǎng)大腦就需要一個(gè)統(tǒng)一的算力評估體系,使不同參與方能夠協(xié)同工作。
“未來算力網(wǎng)絡(luò)提供的是一個(gè)泛在的算力,既包括傳統(tǒng)的算力,也包括網(wǎng)絡(luò)的能力,而算力最難的部分在于如何實(shí)現(xiàn)度量,背后的原因是由于算力網(wǎng)絡(luò)運(yùn)營方可能會基于不同的處理器或者虛擬化軟件來對算力實(shí)現(xiàn)管理,這就可能到會導(dǎo)致對外提供的算力不一樣,因此沒有統(tǒng)一的算力度量衡,就沒辦法進(jìn)行交易?!奔痴苷f。
為此,新華三基于前期與算力網(wǎng)絡(luò)運(yùn)營方合作中的一些具體實(shí)踐以及深度的思考總結(jié),提出了算力評估體系中應(yīng)該重點(diǎn)關(guān)注的三大方向。
首先,是需要分階段構(gòu)建算力評估標(biāo)準(zhǔn)體系。算力評估體系應(yīng)分階段推進(jìn):第一階段基于用戶算力需求,綜合考慮算力因子、網(wǎng)絡(luò)因子以及成本因素,得出綜合評估結(jié)果;第二階段,算力評估需引入軟件服務(wù),建立統(tǒng)一的服務(wù)鏡像倉庫和服務(wù)目錄,為客戶提供算力服務(wù)。
其次,算力評估既需關(guān)注功能,也要考慮服務(wù)的統(tǒng)一。例如,在關(guān)注基本功能實(shí)現(xiàn)的同時(shí),也需考慮安全、容災(zāi)備份等服務(wù)指標(biāo),建立統(tǒng)一的標(biāo)準(zhǔn);更為關(guān)鍵的是,算力評估中的重點(diǎn)應(yīng)聚焦應(yīng)用化、場景化,基于業(yè)務(wù)場景確定不同評估模型,滿足場景適配要求;同時(shí),還要將整網(wǎng)均衡情況、總體社會效益目標(biāo)納入算法,實(shí)現(xiàn)整網(wǎng)資源利用的最大化。
最后,統(tǒng)一標(biāo)準(zhǔn)后方能聚合生態(tài)合力。建立起統(tǒng)一的算力評估標(biāo)準(zhǔn)體系,才能強(qiáng)化產(chǎn)業(yè)鏈各方整體協(xié)同,形成算力網(wǎng)絡(luò)強(qiáng)大的生態(tài)合力,為百行百業(yè)提供易用易獲得,屏蔽廠商和地域差異的泛在算力服務(wù)。
客觀地說,算網(wǎng)融合的終點(diǎn),是希望算力能夠像日常使用中的“水和電”那樣,讓全行業(yè)和全社會都能更加便捷地獲取,但算力并不像水和電那樣是“有型”的,作為一個(gè)“無形”的數(shù)字化能力,算力網(wǎng)絡(luò)的建設(shè)無疑需要通過統(tǒng)一的算力評估體系,按照統(tǒng)一的路線實(shí)現(xiàn)融合創(chuàng)新,這樣才能夠進(jìn)一步加快推進(jìn)算網(wǎng)融合,為中國數(shù)字經(jīng)濟(jì)的高質(zhì)量發(fā)展奠定基礎(chǔ)。
而新華三前瞻性地提出的統(tǒng)一算力評估體系,可以說對推動算力網(wǎng)絡(luò)的建設(shè)有著十分重要的價(jià)值:一方面,通過建立統(tǒng)一的算力網(wǎng)絡(luò)評估標(biāo)準(zhǔn)體系,能夠使得算力網(wǎng)絡(luò)的所有參與者和運(yùn)營者達(dá)成共識,為算力網(wǎng)絡(luò)的建設(shè)提供了寶貴的參考依據(jù);另一方面,新華三提出的算力評估標(biāo)準(zhǔn)體系既是分層次,也是多維度的。如充分考慮到用戶對于功能和服務(wù)的關(guān)注,也考慮到了算力評估體系的應(yīng)用化、場景化、生態(tài)化的需求,是真正站在客戶需求視角的評估體系,這種方式既兼顧了統(tǒng)一性,也實(shí)現(xiàn)了“因地制宜”,相信能夠讓評估標(biāo)準(zhǔn)和結(jié)果更符合算力網(wǎng)絡(luò)建設(shè)的需求。
分層分域管理算網(wǎng)是關(guān)鍵
事實(shí)上,算力網(wǎng)絡(luò)建設(shè)中的難點(diǎn)還不于此,在統(tǒng)一算力評估標(biāo)準(zhǔn)體系之外,算力網(wǎng)絡(luò)中跨域管理,以及智能調(diào)度問題同樣也十分的重要。汲哲認(rèn)為:“東數(shù)西算作為中國前所未有的算網(wǎng)融合工程,東西橫跨上千公里,且將接入全國各地的算力節(jié)點(diǎn),這也對背后的管理框架提出了全新的挑戰(zhàn)。”
“首當(dāng)其沖就是各地建設(shè)周期不同步,如此大的工程,不可能一夜之間完成,因此算網(wǎng)架構(gòu)必須考慮可逐步迭代、分級分區(qū)域演進(jìn);同時(shí),如此龐大的算網(wǎng)融合,對算力調(diào)度的計(jì)算和維護(hù)也是天量的,必須將計(jì)算和管理工作分層分解;此外,不同地區(qū)的云專網(wǎng)由不同廠商的設(shè)備組成,廠商之間接口不兼容,對算網(wǎng)統(tǒng)一調(diào)度的需求,必然需要投入大量工作完成不同廠商之間的對接測試,需要兼顧不同廠商的設(shè)備能力,提供一種對設(shè)備要求較低的互通方案等等?!彼f。
基于此,新華三也設(shè)計(jì)了分層算網(wǎng)大腦架構(gòu),通過系統(tǒng)分解、局部優(yōu)化等方式,實(shí)現(xiàn)具備算力統(tǒng)籌和智能調(diào)度能力的算力網(wǎng)絡(luò),具體來看:
第一,專網(wǎng)構(gòu)建跨區(qū)域分布式算網(wǎng)大腦。分層算網(wǎng)大腦架構(gòu)通過在省內(nèi)部署區(qū)域中心算網(wǎng)大腦,實(shí)現(xiàn)區(qū)域的集中控制、本地優(yōu)先。同時(shí),在集團(tuán)總部部署總部中心算網(wǎng)大腦,分布式控制調(diào)配全網(wǎng)算力資源,降低綜合算力成本。各省與總部中心的算網(wǎng)大腦通過專用網(wǎng)絡(luò)實(shí)現(xiàn)算力協(xié)同,共同構(gòu)成覆蓋全國的超級分布式算網(wǎng)大腦。
第二,算力資源和算力管理要“雙管齊下”。全國范圍集中管控算力資源帶來巨大的計(jì)算量和消息通信,使得算力資源的集中評估至關(guān)重要,從算力資源和管理方面著手才是解決之道;在算力資源上,跨省資源建議只選擇“東數(shù)西算”樞紐資源,社會泛在算力資源僅在省內(nèi)調(diào)度,確??缡≌{(diào)度效益最大化;在管理方面,將路徑計(jì)算分成用戶所在省、全國骨干網(wǎng)、云資源所在省三段,算力評估時(shí)各自計(jì)算路徑,使計(jì)算分布式,提高效率、優(yōu)化管理流程。
第三,復(fù)用現(xiàn)有網(wǎng)絡(luò)協(xié)議為算網(wǎng)建設(shè)“降本增速”。不同廠商的網(wǎng)絡(luò)設(shè)備之間實(shí)現(xiàn)互通才能更好支持算力網(wǎng)絡(luò)需求。因此,新華三提出,應(yīng)盡可能復(fù)用現(xiàn)有的通用網(wǎng)絡(luò)協(xié)議,降低對路由器軟件的依賴和路由器本身性能要求,最小化地減少對路由器的改造,充分利舊,以便于在降低運(yùn)維成本同時(shí),加快算力網(wǎng)絡(luò)落地進(jìn)度。
據(jù)介紹,目前新華三也正以分布式算網(wǎng)大腦為核心,秉承“融合創(chuàng)新”的技術(shù)戰(zhàn)略,為運(yùn)營商和政企客戶提供泛在的算網(wǎng)一體化服務(wù)。所謂“融合”指的是算網(wǎng)智用一體化,從而讓算力和智能實(shí)現(xiàn)無處不在;而“創(chuàng)新”指的是算力度量、分級分布式算網(wǎng)大腦架構(gòu)等技術(shù)創(chuàng)新,既適用于本地化區(qū)域中心控制運(yùn)維,也支持“東數(shù)西算”的宏觀調(diào)度。

展望未來,汲哲最后也表示,相信算力網(wǎng)絡(luò)今后經(jīng)過三個(gè)階段的建設(shè),一定會成為推動中國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的“新引擎”。其中,在起步階段,核心理念是“協(xié)同”,盡管目前算和網(wǎng)依然是兩個(gè)獨(dú)立的個(gè)體,各自編排調(diào)度,但算網(wǎng)開始向布局協(xié)同、運(yùn)營協(xié)同發(fā)展,通過協(xié)同算網(wǎng)服務(wù)入口,實(shí)現(xiàn)資源互調(diào),滿足用戶一站開通需求;在發(fā)展階段,核心理念是“融合”,未來算與網(wǎng)逐步融合發(fā)展,但還是兩個(gè)身體,負(fù)責(zé)管理編排的“大腦”開始融合統(tǒng)一,實(shí)現(xiàn)在算網(wǎng)資源層面的統(tǒng)一管理、編排和調(diào)度;在跨越階段,核心理念是“一體”,到時(shí)候算網(wǎng)的邊界將會被徹底打破,形成算網(wǎng)一體化基礎(chǔ)設(shè)施,為用戶提供融合多技術(shù)要素的一體化服務(wù)。而在此過程中,新華三愿意與運(yùn)營商、云服務(wù)商、設(shè)備廠商一起,通過開放合作、聯(lián)合創(chuàng)新,攜手共同推進(jìn)“東數(shù)西算”戰(zhàn)略的加速落地。
全文總結(jié),隨著“東數(shù)西算”工程大規(guī)模的建設(shè),未來算力網(wǎng)絡(luò)將會成為成為中國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的“底座”與支撐,而新華三提出的統(tǒng)一算力評估標(biāo)準(zhǔn)體系,以及分層分域管理算網(wǎng)的新理念和新方法,無疑將會在今后算力網(wǎng)絡(luò)的建設(shè)中貢獻(xiàn)出更高的價(jià)值,真正讓算力網(wǎng)絡(luò)為百行百業(yè)的數(shù)智化轉(zhuǎn)型升級提供新動能,并驅(qū)動和引領(lǐng)中國數(shù)字經(jīng)濟(jì)走向更為廣闊的新未來。