◎本報記者 金 鳳
僅需3.8毫秒,安徽宿州一家企業(yè)人工智能大模型的訓練數(shù)據(jù),便可以從宿州抵達江蘇南京,再經過12毫秒,算力調度平臺即可將它們送達1300多公里外的甘肅慶陽。在這個過程中,這些“遠道而來”的數(shù)據(jù)的訓練效率,相當于同一個智算中心內訓練數(shù)據(jù)的95%。有了南京和慶陽兩處算力中心的協(xié)助,這家企業(yè)的“算力荒”得到緩解。
近日,隨著基于未來網(wǎng)絡試驗設施(CENI)的全球首個光電融合確定性新型算網(wǎng)基礎設施正式開通,越來越多的企業(yè)開始享受算力“紅利”。
“在新型算網(wǎng)基礎設施的調度下,數(shù)據(jù)不僅可以遠距離傳輸,還能在各地算力中心進行分布式、協(xié)同訓練,且?guī)缀鯖]有損耗�!苯K未來網(wǎng)絡集團有限公司副總經理陶高峰介紹。
1月3日,中國工程院院士、紫金山實驗室首席科學家、江蘇未來網(wǎng)絡研究院院長劉韻潔接受記者采訪時表示:“光電融合確定性新型算網(wǎng)基礎設施的開通,將使我國的算力、人工智能、實體經濟與數(shù)字經濟的融合,擁有一個可靠的底座�!�
2000公里數(shù)據(jù)傳輸無損耗
算力,是支撐人工智能算法運行和數(shù)據(jù)處理的基礎設施。提升算力水平,是加速人工智能技術發(fā)展的關鍵途徑之一。
然而,算力資源的分布往往和需求不匹配,導致資源利用率不高,嚴重影響了數(shù)字經濟的高質量發(fā)展。劉韻潔認為,“東數(shù)西算”工程目前還面臨“算不了、算不起、算不好”的問題。要解決這些難題,需構建低成本的智算互聯(lián)網(wǎng),以此支撐我國人工智能、人工智能大模型的發(fā)展。
“此次開通的光電融合確定性新型算網(wǎng)基礎設施,則為算力的傳輸、交易、應用打造了一個傳得遠、傳得準、傳得穩(wěn)、算得起、算得好的平臺�!碧崭叻褰榻B,該基礎設施依托新型的網(wǎng)絡架構,融合全球領先的光電融合技術與確定性網(wǎng)絡的性能優(yōu)勢,突破了傳統(tǒng)網(wǎng)絡架構中存在的光電信號分離以及高成本、高能耗、低效率等瓶頸,構建了具備2000公里以上無電中繼無損承載、單波單端口400Gb/秒和800Gb/秒的傳輸速率、全網(wǎng)低于5微秒抖動的確定性性能新型網(wǎng)絡,在業(yè)界率先實現(xiàn)丟包率小于十萬分之一,傳輸效率大于90%的高質量網(wǎng)絡傳輸能力。
“通俗地說,就是數(shù)據(jù)可以‘乘坐高鐵’行駛2000公里以上,中途無需換乘即可直達目的地,而且數(shù)據(jù)傳送還能像高鐵一樣準時準點,傳送過程也能零丟包,即使面臨網(wǎng)絡擁堵或遭受攻擊時,仍能提供確定性保障,400G接口網(wǎng)絡設備的成本還能下降60%以上。”陶高峰解釋,在這張看不見的網(wǎng)絡中,來自全國23家算力接入單位提供的算力,匯入全國6個智算中心和5個超算中心,再經由算網(wǎng)后臺的調度,輸往全國各地的高校院所、企業(yè)……
讓算力交易像購物一樣便捷
光電融合確定性新型算網(wǎng)基礎設施由江蘇未來網(wǎng)絡集團聯(lián)合紫金山實驗室等單位建設。目前,一期工程覆蓋北京、南京、上海、武漢、貴陽、杭州、蘇州、張家口、慶陽9個城市,接入算力總規(guī)模已達106000P。這些算力,來自23家算力接入單位,可以實現(xiàn)“一跳入算、一鍵調算、一網(wǎng)通達”。
“這相當于構建了一個龐大的算力資源池,你也可以把它理解為一個算力交易的‘電商平臺’。23家算力接入單位是算力供應商,各地的企業(yè)、高校等機構是用戶�!惶胨恪傅氖怯脩糁恍柰ㄟ^一臺算力設備連接到算網(wǎng),我們便能根據(jù)各地的算力分布,為用戶匹配合適的算力資源;‘一鍵調算’指的是我們可以根據(jù)用戶的需求為其追加或者調減算力,并盡量就近調撥算力;‘一網(wǎng)通達’則可以讓用戶在算網(wǎng)中使用所有‘供應商’的算力,而不用自己再去建設、升級算力基礎設備�!碧崭叻褰忉�,支撐算網(wǎng)建設的一系列關鍵技術能力,可以滿足人工智能大模型訓練高通量網(wǎng)絡、AI智能體推理高彈性網(wǎng)絡、工業(yè)控制高可用網(wǎng)絡等關鍵領域對服務可定制高性能網(wǎng)絡的迫切需求。
值得注意的是,光電融合確定性新型算網(wǎng)基礎設施是基于CENI建成的,后者是我國信息與網(wǎng)絡領域首個國家重大科技基礎設施。1月2日召開的南京科技大會暨產業(yè)科技創(chuàng)新工作推進會宣布CENI全面竣工。
“光電融合確定性新型算網(wǎng)基礎設施使用CENI的部分光纜波道資源,可以與CENI聯(lián)動為用戶提供算力資源。”陶高峰舉例,在算網(wǎng)目前沒有覆蓋的城市,用戶可以接入CENI進入算網(wǎng),使用算力。
探索低空經濟等領域使用場景
算力是人工智能系統(tǒng)實現(xiàn)高效、準確處理任務的物質基礎。在CENI演示中心,記者看到,大屏上的綠色代碼快速跳動,宿州和南京相距500余公里的兩個智能中心進行著百億參數(shù)的大模型分布式訓練,傳輸時延不到8毫秒,抖動僅40微秒,丟包率為0。
“我們的目標是賦能千行百業(yè)。”陶高峰表示,憑借先進的架構,以及廣覆蓋、大通量、超融合的服務能力,這一基礎設施能夠支持“東數(shù)西算”等國家重大工程,加速東西部數(shù)據(jù)流通與跨區(qū)域協(xié)同,賦能人工智能業(yè)務高速骨干網(wǎng),構筑國家算網(wǎng)新底座。同時,該設施能夠支撐智能制造、智慧城市、智慧能源、智慧政府等應用,驅動關鍵領域數(shù)字化轉型。
陶高峰表示,目前,未來網(wǎng)絡集團正在與各個算力接入單位合作,進行大模型分布式訓練、協(xié)同訓練的布局,希望做到“以網(wǎng)強算”,推動國產千億、萬億參數(shù)大模型的研制、使用。
“最近,我們正在探索算力在低空經濟、水庫巡檢、高速公路巡檢、遠程醫(yī)療等領域的使用場景�!碧崭叻褰榻B,未來,團隊還會將更多的企業(yè)算力、社會算力接入新型算網(wǎng)基礎設施,開拓算力應用的新場景。