?? 超算互聯(lián)網(wǎng)是一種以超級(jí)計(jì)算機(jī)和高速互聯(lián)網(wǎng)為基礎(chǔ)的先進(jìn)計(jì)算基礎(chǔ)設(shè)施,它以高速網(wǎng)絡(luò)連接分布各地的超算中心,聚合
多個(gè)超算中心的軟硬件資源,并通過(guò)建設(shè)超算資源共享與交易平臺(tái),支持算力、數(shù)據(jù)、軟件、應(yīng)用等資源的共享與交易,同時(shí)向用
戶提供多樣化的算力服務(wù)。
??新基建、東數(shù)西算等工程的實(shí)施,對(duì)于推動(dòng)算力、算法、數(shù)據(jù)、應(yīng)用資源等的集約化和服務(wù)化創(chuàng)新提出了更高的要求,對(duì)構(gòu)建
可提供高端算力服務(wù)的一體化先進(jìn)計(jì)算基礎(chǔ)設(shè)施提出了新的挑戰(zhàn)。
??“為了解決我國(guó)超算中心運(yùn)行面臨的挑戰(zhàn),提升我國(guó)超算的應(yīng)用水平,推動(dòng)超算中心從提供裸機(jī)時(shí)向提供多領(lǐng)域應(yīng)用服務(wù)轉(zhuǎn)變
,構(gòu)建超算互聯(lián)網(wǎng)勢(shì)在必行。”6月22日,國(guó)家超級(jí)計(jì)算無(wú)錫中心主任楊廣文在接受科技日?qǐng)?bào)記者專訪時(shí)說(shuō)。
??楊廣文透露,目前我國(guó)超算互聯(lián)網(wǎng)原型項(xiàng)目研究已取得初步成果,將于近期對(duì)外正式發(fā)布。今后,這些成果將能進(jìn)一步支持智
能計(jì)算中心的互聯(lián),并在更高層面上支持未來(lái)算力網(wǎng)的構(gòu)建與營(yíng)運(yùn)。
??布局建設(shè)超算互聯(lián)網(wǎng)意義重大
??楊廣文介紹,超算互聯(lián)網(wǎng)是一種以超級(jí)計(jì)算機(jī)和高速互聯(lián)網(wǎng)為基礎(chǔ)的國(guó)家級(jí)先進(jìn)計(jì)算基礎(chǔ)設(shè)施,它以高速網(wǎng)絡(luò)連接分布各地的
超算中心,聚合多個(gè)超算中心的軟硬件資源,并通過(guò)建設(shè)超算資源共享與交易平臺(tái),支持算力、數(shù)據(jù)、軟件、應(yīng)用等資源的共享與
交易,同時(shí)向用戶提供多樣化的算力服務(wù)。
??作為一種先進(jìn)計(jì)算基礎(chǔ)設(shè)施,超算互聯(lián)網(wǎng)將超算所提供的強(qiáng)大計(jì)算變?yōu)橛?jì)算服務(wù),并以一種標(biāo)準(zhǔn)化的形式提供給計(jì)算服務(wù)的使
用者。
??“超算互聯(lián)網(wǎng)通過(guò)制定資源接入、共享、交易等標(biāo)準(zhǔn),構(gòu)建具備資源共享與交易能力的公益性資源平臺(tái),可將各級(jí)超算中心、
云計(jì)算企業(yè)、科研機(jī)構(gòu)等不同來(lái)源的算力、數(shù)據(jù)、軟件、應(yīng)用等統(tǒng)一為超算資源并整合到一起,為科研、生產(chǎn)生活等提供高效、專
業(yè)的超級(jí)計(jì)算服務(wù)。”楊廣文說(shuō)。
??在楊廣文看來(lái),和傳統(tǒng)的超算應(yīng)用相比,超算互聯(lián)網(wǎng)的最大特點(diǎn)是將提供超算算力轉(zhuǎn)變?yōu)樘峁┏銘?yīng)用服務(wù),這就帶來(lái)了超算
互聯(lián)網(wǎng)在應(yīng)用模式上的巨大改變,對(duì)超算及其應(yīng)用的發(fā)展具有相當(dāng)大的推動(dòng)作用。
??在清華大學(xué)副教授黃震春看來(lái),作為一種信息基礎(chǔ)設(shè)施,超算互聯(lián)網(wǎng)起到了連接下層資源提供者與上層用戶的作用。因此,從
商業(yè)運(yùn)營(yíng)角度來(lái)看,超算互聯(lián)網(wǎng)的核心服務(wù)平臺(tái)應(yīng)當(dāng)是一個(gè)公益平臺(tái),在國(guó)家相關(guān)部門的支持與指導(dǎo)下應(yīng)用于超級(jí)計(jì)算服務(wù)市場(chǎng)。
??國(guó)家超級(jí)計(jì)算無(wú)錫中心研發(fā)工程師葉躍進(jìn)認(rèn)為,在建設(shè)超算互聯(lián)網(wǎng)時(shí),要改變超算中心分散獨(dú)立運(yùn)營(yíng)導(dǎo)致的算力碎片化和資源
利用不均衡的局面,實(shí)現(xiàn)超算資源的互聯(lián)互通和資源共享、交易等;同時(shí),要構(gòu)建超級(jí)計(jì)算管理及應(yīng)用平臺(tái)服務(wù)體系,提供跨域的
統(tǒng)一服務(wù)策略和評(píng)價(jià)指標(biāo),提供并行應(yīng)用軟件,以及軟件的共享與交易機(jī)制;此外,還要支持建設(shè)面向各領(lǐng)域和重點(diǎn)行業(yè)的應(yīng)用平
臺(tái),充分利用國(guó)家級(jí)超級(jí)計(jì)算資源,有效支持重點(diǎn)科研與行業(yè)用戶,引導(dǎo)、培育超級(jí)計(jì)算資源和服務(wù)的商品化和市場(chǎng)化,從根本上
提高我國(guó)并行算法與并行軟件的研發(fā)水平,使超級(jí)計(jì)算更好地服務(wù)于科技創(chuàng)新、產(chǎn)業(yè)升級(jí)等。
??“超算互聯(lián)網(wǎng)的建設(shè)和發(fā)展,將在國(guó)家層面給出實(shí)現(xiàn)全國(guó)大數(shù)據(jù)中心一體化協(xié)同創(chuàng)新的高質(zhì)量解決方案,為開(kāi)啟算力經(jīng)濟(jì)時(shí)代
的世紀(jì)工程提供堅(jiān)實(shí)的基礎(chǔ)。”楊廣文說(shuō)。
??超算互聯(lián)網(wǎng)仍面臨諸多挑戰(zhàn)
??“超算互聯(lián)網(wǎng)的核心目標(biāo)是確保超級(jí)計(jì)算服務(wù)實(shí)現(xiàn)從傳統(tǒng)的提供算力到提供服務(wù)的革命性轉(zhuǎn)變。”楊廣文說(shuō),只有實(shí)現(xiàn)了資源
的高速互聯(lián),各種超算資源才有可能成為一個(gè)有機(jī)整體,可能支持面向應(yīng)用領(lǐng)域的行業(yè)或者產(chǎn)業(yè)聯(lián)合體的形成,構(gòu)建應(yīng)用平臺(tái)和應(yīng)用
系統(tǒng),為應(yīng)用領(lǐng)域和相關(guān)產(chǎn)業(yè)提供有效的高性能計(jì)算應(yīng)用服務(wù)。
??楊廣文介紹,目前超算互聯(lián)網(wǎng)的構(gòu)建和運(yùn)營(yíng)無(wú)論在技術(shù)上、人才上還是在商業(yè)模式、產(chǎn)業(yè)培育上都面臨著諸多挑戰(zhàn)。
??從技術(shù)層面來(lái)看,超算互聯(lián)網(wǎng)仍需要通過(guò)高速網(wǎng)絡(luò)高效連接來(lái)自不同超算中心和資源提供單位的、分布異構(gòu)的超算資源,需要
實(shí)現(xiàn)算力、存儲(chǔ)、數(shù)據(jù)等各種高性能計(jì)算資源的共享和高性能計(jì)算任務(wù)的有效調(diào)度。
??從人才資源來(lái)看,超算互聯(lián)網(wǎng)的構(gòu)建與運(yùn)營(yíng)涉及到高性能計(jì)算、計(jì)算機(jī)網(wǎng)絡(luò)、并行軟件、分布式系統(tǒng)等計(jì)算機(jī)領(lǐng)域的諸多研究
方向,尤其離不開(kāi)以超算中心為主的超算運(yùn)營(yíng)管理與技術(shù)開(kāi)發(fā)人才,需要具備相關(guān)應(yīng)用領(lǐng)域和行業(yè)專業(yè)知識(shí)、行業(yè)經(jīng)驗(yàn)的人才隊(duì)伍。
??從產(chǎn)業(yè)生態(tài)來(lái)看,超算互聯(lián)網(wǎng)構(gòu)建于超級(jí)計(jì)算和高速網(wǎng)絡(luò)的基礎(chǔ)之上,對(duì)相關(guān)產(chǎn)業(yè)生態(tài)的依賴非常明顯,從操作系統(tǒng)、基礎(chǔ)軟
件到并行應(yīng)用軟件的開(kāi)發(fā)與優(yōu)化,這些都會(huì)影響到超算互聯(lián)網(wǎng)的構(gòu)建與運(yùn)營(yíng)。
??“在面向應(yīng)用領(lǐng)域的專業(yè)超算服務(wù)產(chǎn)業(yè)初期和發(fā)展階段,亟須國(guó)家在產(chǎn)業(yè)政策等方面給予大力扶持,以推動(dòng)具有技術(shù)和市場(chǎng)優(yōu)
勢(shì)的企業(yè)聯(lián)盟或集群快速成長(zhǎng)。”葉躍進(jìn)說(shuō)。
??建設(shè)過(guò)程中要堅(jiān)持標(biāo)準(zhǔn)先行
??“建設(shè)超算互聯(lián)網(wǎng),將有效聚集超算硬件資源和專業(yè)人才,并基于超級(jí)計(jì)算系統(tǒng)研究并行軟件的開(kāi)發(fā)、測(cè)試、遷移、共享和服
務(wù)化技術(shù),支持和鼓勵(lì)并行應(yīng)用軟件的開(kāi)發(fā)。”楊廣文說(shuō)。
??黃震春認(rèn)為,在超算互聯(lián)網(wǎng)的建設(shè)過(guò)程中,需要遵循標(biāo)準(zhǔn)化、服務(wù)化、領(lǐng)域化等一系列原則,以保證超算互聯(lián)網(wǎng)的開(kāi)放性和普
適性;尤其要堅(jiān)持標(biāo)準(zhǔn)先行,這既有利于超算互聯(lián)網(wǎng)的合作和推廣,又能通過(guò)成熟的標(biāo)準(zhǔn)保證系統(tǒng)的兼容、穩(wěn)定、可用,更能促進(jìn)
相關(guān)標(biāo)準(zhǔn)的開(kāi)放,保證超算互聯(lián)網(wǎng)的不斷發(fā)展與演進(jìn)。
??我國(guó)高度重視超算互聯(lián)網(wǎng)工程,并于2020年在重點(diǎn)研發(fā)計(jì)劃的“高性能計(jì)算”重點(diǎn)專項(xiàng)中,專門部署超算互聯(lián)網(wǎng)原型項(xiàng)目——
國(guó)家高性能計(jì)算環(huán)境領(lǐng)域應(yīng)用平臺(tái)及服務(wù)體系研究與構(gòu)建,目前已在多個(gè)方面取得了重要進(jìn)展。
??值得一提的是,超算互聯(lián)網(wǎng)原型項(xiàng)目還得到了之江實(shí)驗(yàn)室的大力支持,同時(shí)也能更好地支持之江實(shí)驗(yàn)室“智能計(jì)算數(shù)字反應(yīng)堆”
重大項(xiàng)目的實(shí)施。
??楊廣文介紹,超算互聯(lián)網(wǎng)原型項(xiàng)目可實(shí)現(xiàn)多個(gè)國(guó)家超級(jí)計(jì)算中心之間每秒千億字節(jié)的高速網(wǎng)絡(luò)互聯(lián)互通,聚合每秒不少于200億
億次浮點(diǎn)運(yùn)算的計(jì)算能力和1艾字節(jié)的存儲(chǔ)能力。目前超算互聯(lián)網(wǎng)的高速互聯(lián)采用開(kāi)放式的架構(gòu)和標(biāo)準(zhǔn)協(xié)議,可支持未來(lái)網(wǎng)絡(luò)帶寬升
級(jí)和接入更多符合條件的國(guó)家級(jí)及其他各級(jí)超算中心、資源供應(yīng)商與用戶單位。
??同時(shí),超算互聯(lián)網(wǎng)建設(shè)團(tuán)隊(duì)還針對(duì)核心資源網(wǎng)的超級(jí)計(jì)算系統(tǒng),研發(fā)支撐應(yīng)用領(lǐng)域平臺(tái)構(gòu)建的技術(shù),設(shè)計(jì)一套基于核心資源網(wǎng)的
應(yīng)用平臺(tái)搭建支撐工具。
??相關(guān)專家認(rèn)為,超算互聯(lián)網(wǎng)原型項(xiàng)目的順利實(shí)施,證明了超算互聯(lián)網(wǎng)在技術(shù)上的可行性和對(duì)行業(yè)與多領(lǐng)域應(yīng)用的強(qiáng)大支撐能力,
將為我國(guó)科技創(chuàng)新、產(chǎn)業(yè)升級(jí)、社會(huì)發(fā)展等提供基于超級(jí)算力的專業(yè)服務(wù),有效帶動(dòng)相關(guān)產(chǎn)業(yè)發(fā)展,支撐國(guó)家相關(guān)戰(zhàn)略的順利實(shí)施。