??
6月16日,在上海舉行的人工智能框架生態(tài)峰會上,上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動,首批22家單位正式入駐。資料照片
??編者按
??以大模型為代表的人工智能賽道上,根技術正在成為決勝的關鍵。作為當前全球科技發(fā)展的重要專項,人工智能也是我國的重要戰(zhàn)略先導機遇。
隨著大模型等技術的商業(yè)化應用,人工智能已深度融入生產(chǎn)生活,全球各國都在孵化和孕育各類通用的行業(yè)大模型,要在這一賽道上實現(xiàn)領先,就必
須以底層技術突破帶動上下游要素集聚,不斷提升核心競爭力。
??AI框架:支撐人工智能產(chǎn)業(yè)創(chuàng)新
??今年以來,大模型帶火通用人工智能(AI)賽道。作為人工智能領域的根技術,AI框架相當于AI領域的操作系統(tǒng)。6月16日,以“一起昇思,無盡
創(chuàng)新”為主題的人工智能框架生態(tài)峰會在上海舉行,業(yè)界圍繞大模型與科學智能領域AI框架技術展開深度交流,共同探討AI技術創(chuàng)新與行業(yè)融合大背景
下的AI框架生態(tài)模式與場景應用,力圖推動人工智能產(chǎn)業(yè)創(chuàng)新。
??大模型展現(xiàn)產(chǎn)業(yè)應用前景
??“我是昇思開源社區(qū)的一名開發(fā)者,‘紫東太初’能否以中國國畫的形式現(xiàn)場生成一幅竹林圖片?”當一位現(xiàn)場觀眾提出要求,幾秒鐘后大屏幕上
就出現(xiàn)了一幅竹林水墨畫……峰會上,中科院自動化研究所發(fā)布的全模態(tài)大模型“紫東太初”2.0現(xiàn)場展示的圖像生成能力令人驚嘆。
??除了支持圖像生成,“紫東太初”2.0還支持多輪問答、文本創(chuàng)作、3D理解、信號分析等跨模態(tài)任務,例如在三維場景里實現(xiàn)精準定位、通過圖像
與聲音的結合完成場景分析等。
??中科院自動化研究所所長徐波介紹,“紫東太初”全模態(tài)大模型是在多模態(tài)大模型“紫東太初”1.0基礎上升級打造的2.0版本,在語音、圖像和文
本三模態(tài)的基礎上,加入視頻、信號、3D點云等模態(tài)數(shù)據(jù),突破了認知增強的多模態(tài)關聯(lián)等關鍵技術,具備全模態(tài)理解能力、生成能力和關聯(lián)能力。
??“紫東太初”2.0可以理解三維場景、信號等數(shù)字物聯(lián)時代的重要信息,完成了音樂、圖片和視頻等數(shù)據(jù)之間的跨模態(tài)對齊,能夠處理音樂視頻分析、
三維導航等多模態(tài)關聯(lián)應用需求,并可實現(xiàn)音樂、視頻等多模態(tài)內(nèi)容理解和生成。本屆峰會首次對外實時展示了該模型在音樂理解與生成、三維場景導航、
信號理解、多模態(tài)對話等方面的全新功能。
??“從1.0到2.0,‘紫東太初’大模型打通了感知、認知乃至決策的交互屏障,使人工智能進一步感知世界、認知世界,從而延伸出更加強大的通用能
力。”徐波說。
??目前,“紫東太初”大模型在神經(jīng)外科手術導航、短視頻內(nèi)容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領域展現(xiàn)出一定的產(chǎn)業(yè)應
用前景。例如在醫(yī)療場景,“紫東太初”大模型部署于神經(jīng)外科機器人MicroNeuro,可實現(xiàn)在術中實時融合視覺、觸覺等多模態(tài)信息,協(xié)助醫(yī)生對手術
場景進行實時推理判斷。
??據(jù)徐波介紹,基于“紫東太初”2.0的全棧國產(chǎn)化、低代碼一站式開發(fā)的“紫東太初”開放服務平臺已上線,支持公有云、私有云一鍵部署,使能行業(yè)
大模型高效率開發(fā)。“未來3至5年,包括‘紫東太初’在內(nèi)的我國大模型技術,將在促進數(shù)字經(jīng)濟發(fā)展方面發(fā)揮重要作用,進一步提升各行業(yè)的勞動生產(chǎn)率。”
??AI框架支撐大模型“快跑”
??“從算法到硬件、算力,‘紫東太初’都是‘中國造’。”中科院自動化研究所紫東太初大模型研究中心常務副主任王金橋介紹,大模型算法為中科
院自動化研究所自研,以國產(chǎn)化人工智能硬件和框架作為基礎,算力則由武漢人工智能計算中心提供支持,“在國產(chǎn)軟硬件的支撐下,我們的大模型一樣
能跑得很好、很快。”
??支撐“紫東太初”的人工智能框架正是華為公司的昇思。據(jù)昇思開源社區(qū)理事長丁誠介紹:“人工智能框架是人工智能技術體系的核心中堅,向下賦
能多樣化算力,通過高效調度發(fā)揮系統(tǒng)最佳性能;向上孵化各類創(chuàng)新算法模型,給用戶提供便捷的操作接口。”
??本屆峰會上,上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動。該創(chuàng)新中心的定位是以華為公司的人工智能框架昇思為基礎,支持全國范圍的人工
智能技術企業(yè)、高校與科研院所孵化大模型、研究科學智能技術,進而在互聯(lián)網(wǎng)、金融、教育等關鍵產(chǎn)業(yè)方向上打造富有競爭力的人工智能應用場景,推
動產(chǎn)業(yè)集聚。上海人工智能實驗室、上海交通大學、中國商飛上海飛機設計研究院、中國科學院上海藥物研究所、云從科技等首批22家單位正式入駐創(chuàng)新
中心。入駐單位將聯(lián)合昇思開源社區(qū)進行大模型創(chuàng)新與人工智能產(chǎn)學研轉化,助力創(chuàng)新中心成為人工智能技術與應用創(chuàng)新的“發(fā)源地”。
??數(shù)據(jù)顯示,華為昇思自2020年3月28日開源以來,社區(qū)已累計1.3萬貢獻者、474萬下載量,服務企業(yè)數(shù)量5500家、開源模型400多個,與240家科研
院所展開合作,發(fā)表頂級會議論文超過900篇。具體來看,昇思一方面依托大模型和科學智能創(chuàng)新成果,成立了遙感、流體、多模態(tài)三大產(chǎn)業(yè)聯(lián)合體,加速
技術成果轉化;另一方面向端、邊、云全場景開放,適配國內(nèi)主流的人工智能芯片和硬件設備超過20款。
??峰會上,丁誠介紹了昇思開源社區(qū)面向未來的四大創(chuàng)新方向,包括基于“構建大模型全流程使能、科學計算新范式”的技術創(chuàng)新,以加速AI新應用的孵
化;基于“大模型平臺、Study Group、極客周、全球開源生態(tài)”的運營創(chuàng)新,讓社區(qū)成果更高效地推廣到用戶;基于“面向學習、成長、研究的不同階段
開發(fā)者提供不同培養(yǎng)模式”的人才創(chuàng)新,培育AI產(chǎn)業(yè)土壤;以及基于“建立產(chǎn)業(yè)聯(lián)合體、行業(yè)專區(qū)等新手段,持續(xù)完善多樣化算力和硬件支持”的生態(tài)創(chuàng)新。
??“科學智能”成下一個“爆點”
??“作為后發(fā)框架,要想技術超越或者領先,核心就是找到AI技術變革的下一條新賽道,只有當新賽道出現(xiàn)的時候才有超車的機會。”丁誠表示。
??相對于國際上較早開源的AI框架,昇思的確是后來者。早在三年之前,昇思就開始布局大模型技術,也獲得了一系列大模型原生生態(tài)創(chuàng)新成果。那么在
下一個時代,新賽道是什么?答案很可能是“科學智能”。
??“在每一個科學問題里可能都包含著一個基本的數(shù)學方程。例如在流體力學計算中會大量消耗算力,但其實數(shù)學原理很簡單,就是一個納維-斯托克斯方
程的求解。如果用傳統(tǒng)方法計算可能需要幾十年、上百年算不完的問題,用AI的方式就有可能10倍或者100倍地加速求解。”丁誠解釋。
??據(jù)業(yè)內(nèi)人士介紹,從最新的國際頂級期刊不難發(fā)現(xiàn),從人工智能驅動的蛋白質功能機理探索和理性設計,到基于人工智能的藥物發(fā)現(xiàn)和藥物優(yōu)化,從酶
改造與生物基化學品的生成,再到科學育種與氣象預測——不論是微觀世界的多尺度探索,還是宏觀、微觀科學成果的應用,人工智能求解高維函數(shù)、解決
復雜問題的優(yōu)勢正在持續(xù)釋放。從生命體的基本組成到世界工業(yè)的基本要素,人工智能不僅是解決具體問題的有力工具,更成為重新定義科學問題的系統(tǒng)性
思路。
??本屆峰會上,中國科學院張東輝院士的主題演講《關于昇思MindSpore在計算化學中應用的設想》介紹了與昇思團隊合作研發(fā)高性能水團簇分子勢能模
型,借助AI之力揭示水的種種特性。
??“在昇思發(fā)布的2.0版本當中提出了科學計算融合架構,目的就是在這個新賽道里獲得更多的技術領先機會,打造自己的原生生態(tài)。”丁誠表示。
??大模型:加快創(chuàng)新策源賦能實體經(jīng)濟
??科技部新一代人工智能發(fā)展研究中心等機構發(fā)布的數(shù)據(jù)顯示,中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。這一席卷科技界的AI革命,將如何改變世界?
大模型又將如何一手促進創(chuàng)新策源,一手服務實體經(jīng)濟?
??大模型探索大應用
??在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳,可以和大模型“商量”,用中文“商量”一下。
??記者在現(xiàn)場感受發(fā)現(xiàn),作為千億級參數(shù)的自然語言處理模型“商量”,它不僅可以進行多輪對話、人機共創(chuàng)童話故事,還可以自動生成簡單代碼、進行
“文生圖”等。例如,在輸入了20張“港風”照片后,生成式AI就可以自動生成一張類似風格的“氛圍感”圖片。
??“無論是讓大模型寫出一首質量過關的古詩,還是根據(jù)描述生成圖像,都要求其對中文語言的理解足夠深刻。這需要經(jīng)過多輪對話的訓練,包括輔助語
料的投喂,才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學家王曉剛說。
??語言類大模型不是唯一形態(tài),多種通用大模型正在持續(xù)拓展應用場景。科技部新一代人工智能發(fā)展研究中心等機構發(fā)布的《中國人工智能大模型地圖研
究報告》顯示,中國研發(fā)的大模型數(shù)量排名全球第二,僅次于美國。
??一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設計等行業(yè)加速滲透;另一方面,一些垂直專業(yè)類大模型不斷深化落地,生物制藥、遙感、氣象等大
模型正在發(fā)揮縱深優(yōu)勢。
??4月初,上海人工智能實驗室聯(lián)合中國科學技術大學、上海交通大學、南京信息工程大學、中國科學院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天
氣預報大模型“風烏”,30秒生成未來10天全球氣象高精度預報結果。
??在氣象氣候預報任務中,全球中期天氣預報是重要預測任務之一,它以預測未來14天內(nèi)的大氣系統(tǒng)狀態(tài)為目標。“風烏”在預報精度上降低了誤差,在時
效上突破了10天,而且僅需單GPU(圖形處理器)便可運行。
??上海人工智能實驗室領軍科學家歐陽萬里說:“‘風烏’取名自秦漢時期的‘相風銅烏’,是世界上最早的測風設備。天氣預報大模型‘風烏’承載中國
古人的智慧,也寓意實驗室致力于在以氣象為代表的人工智能服務科學領域不懈探索。”
??大算力搭建新“底座”
??出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時間以來,各地都在為人工智能的創(chuàng)新策源“鋪路”。
??5月30日,北京發(fā)布《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措
施》等方案;深圳發(fā)布關于加快推動人工智能高質量發(fā)展高水平應用行動方案;上海市經(jīng)信委表示,超大規(guī)模預訓練模型是人工智能從專業(yè)智能走向通用智
能的關鍵技術,未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應用高地,推進算力資源統(tǒng)一調度。
??算力是研發(fā)大模型必不可少的基礎設施,已成為不少城市爭相布局的焦點。“近期生成式人工智能等應用大爆發(fā),推動了算力需求激增。很多企業(yè)在落
戶前都會問,算力需求能否被滿足,這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說,這也是臨港發(fā)力構建更為完善的算力產(chǎn)業(yè)生態(tài)、搭建
公共平臺的初衷。
??瞄準產(chǎn)業(yè)痛點,智能算力更需要一體化調度、經(jīng)濟化使用。專家認為,“東數(shù)西算”工程的全面實施,將一手促進東部數(shù)字經(jīng)濟產(chǎn)業(yè)鏈向西部延伸拓展,
一手讓算力資源精準配置和按需獲取,有效降低能源消耗。
??“我們將在貴安新區(qū)共同合作建設新的產(chǎn)業(yè)園區(qū),來打造滬黔科技創(chuàng)新成果的轉化中心。”貴陽市市長馬寧宇說,貴安正在規(guī)劃建設全國規(guī)模最大,存算能
力一流的高安全、高可靠、高可用的數(shù)據(jù)中心集群,為大數(shù)據(jù)、大算力、大模型的技術發(fā)展和應用提供廣闊空間。
??“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認為,“東數(shù)西算”工程可以解決算力問題,在GPU運算中,西部成本比東部便宜一半。
業(yè)內(nèi)其實也在探索“東數(shù)西訓”,把非實時計算的AI訓練過程放在西部進行,涉及需要實時運算的推理過程則在東部直接完成,更好地調度算力、節(jié)約成本。
??設規(guī)則促進“好模型”
??既為創(chuàng)新“加油”,也為發(fā)展“立規(guī)”。專家認為,目前大模型總體人才不足,不少應用領域還未有成熟開發(fā),數(shù)據(jù)治理也有待提升,這既需要政府部門為
創(chuàng)新的落地搭平臺、找場景,也需要為其安全探索設置好邊界。
??今年4月,國家網(wǎng)信辦發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》,對用于生成式人工智能產(chǎn)品的預訓練、優(yōu)化訓練數(shù)據(jù)提出明確要求。從治理
原則到倫理規(guī)范,近年來我國一直加強對人工智能行業(yè)“立規(guī)”。
??“大模型推動人工智能實現(xiàn)一次歷史性跨越,中國經(jīng)濟社會高質量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據(jù)基礎。”中國科學技術信息研究所所長、科技部新
一代人工智能發(fā)展研究中心主任趙志耘認為,未來需要在四個方面著力:加強資源和研發(fā)力量統(tǒng)籌,促進產(chǎn)學研合作與開源開放;加強大模型技術研發(fā),提升學
術和開源影響力;強化大模型發(fā)展中的場景牽引作用,打造大模型標桿項目;強化政策支持和配套服務,加快推動大模型應用落地。
??從更深層次看,助力大模型走深走透,還需要更高質量的數(shù)據(jù)庫。“未來對數(shù)據(jù)的高質量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事
長王健宗說,比如以前標注一張圖,只需要說這是“一個公園”;但現(xiàn)在標注就需要詳細描述為“母親和小孩在公園里散步”,標注難度和工作數(shù)量級呈指數(shù)上升。
??“數(shù)據(jù)變成必要的生產(chǎn)要素后,怎么安全合理地使用,是政府必須考慮的問題。以后對數(shù)據(jù)的質量要求、使用門檻都會越來越高,需要規(guī)則的提前制定。”
趙志耘說。
??大算力:為大模型搭建“高速路”
??以ChatGPT為代表的人工智能技術發(fā)展,引發(fā)了全球算力需求的進一步增長。迎接新一輪人工智能熱潮,中國的算力增長點在哪里?什么樣的算力更精準高
效?記者日前采訪業(yè)內(nèi)專家,前瞻算力發(fā)展趨勢。
??在全球新一輪人工智能技術發(fā)展浪潮中,大模型是一個關鍵詞。ChatGPT等正是通過大模型來“學習”海量數(shù)據(jù),并由此取得突破。
??中國科學院院士陳潤生表示,人工智能大模型在應用層面正在發(fā)生巨大變化,未來將在多個領域引發(fā)變革,同時也會消耗大量算力。
??中國工程院院士鄭緯民說,做大模型必須要有“大算力”,ChatGPT正是基于大規(guī)模算力基礎設施的產(chǎn)物。
??不久前舉行的中關村論壇上,科技部新一代人工智能發(fā)展研究中心發(fā)布了《中國人工智能大模型地圖研究報告》。報告顯示,我國研發(fā)的大模型數(shù)量排名全
球第二。
??中國科學院計算機網(wǎng)絡信息中心研究員陸忠華表示,全社會對算力的需求日益增長,人工智能應用的算力需求更加突出,要迎接好這一趨勢。
??近年來,我國人工智能算力的占比在升高。“根據(jù)估算,人工智能算力過去幾年大體上年均增長率為70%,其他算力大概增長30%左右。”中國信息通信研
究院院長余曉暉說。
??清華大學計算機系教授陳文光也觀察到,隨著人工智能的滲透程度加深,相比傳統(tǒng)超算中心,智算中心的利用率變得更高。
??國家高性能計算機工程技術研究中心副主任曹振南則表示,雖然算力常被分為超算和人工智能計算,但二者有許多相像之處,最大區(qū)別在于對計算精度的要
求不同。
??“目前人工智能算力的缺口較大,一些人工智能應用為追求計算性能而降低了精度要求。但如果算力變得易得、便宜,一些人工智能應用可能又會對精度提
出一些高要求。”曹振南說。
??專家認為,“通用算力+專用算力”將成為人工智能算力基礎設施的建設關鍵。一方面要滿足廣泛的應用場景,具備普適性,實現(xiàn)通用;另一方面也能支持部
分對計算精度、效率要求高的個性化應用場景,具備高效性,實現(xiàn)專用。
??在專家看來,將已有的、不同體系架構的算力中心通過網(wǎng)絡連接起來,可以合理配置、共享、調度、釋放更多算力,并降低應用門檻。
??在科技部高新技術司的牽頭下,國家超算互聯(lián)網(wǎng)工作已經(jīng)啟動。按照規(guī)劃,到2025年底,國家超算互聯(lián)網(wǎng)將成為支撐數(shù)字中國建設的“高速路”。
??曹振南介紹,超算互聯(lián)網(wǎng)平臺的建設目標之一,正是致力于解決算力設施分布不均衡的問題,實現(xiàn)算力資源的互聯(lián)互通、資源共享。
??中國科學院院士錢德沛表示,算力基礎設施提供的應當不僅是算力,更要有用戶所需的軟件或應用服務,這樣才能將算力資源最大化。
??“希望超算算力未來能像電力一樣走進千家萬戶,任何地方、任何時間都可以獲得大數(shù)據(jù)算力來支持相關應用。”錢德沛說。(記者 吳蔚 周琳 楊有宗 潘德鑫 董瑞豐)