??
怎樣判定生成式語言大模型會否“一本正經(jīng)地胡說八道”?如何知道自動駕駛系統(tǒng)能夠抵抗得住外界惡意攻擊?功能強(qiáng)大的AI(人工智能)大模型也需要
“健康檢測”,以確保其準(zhǔn)確性、抗攻擊性及安全性。
??近日,上海首家生成式人工智能(AIGC)質(zhì)量檢驗(yàn)檢測中心掛牌批籌,為AI大模型等智能軟件提供專業(yè)化“體檢”。掛牌兩個月來,這家AI質(zhì)檢中心
已出具75份“體檢報告”。
??在AI質(zhì)檢火爆的背后,折射出整個產(chǎn)業(yè)對于行業(yè)質(zhì)量規(guī)范的渴求。盡管目前AI檢測尚屬于企業(yè)自主行為,但未來對于大模型安全性、可解釋性、倫理風(fēng)
險的檢測檢驗(yàn),將會形成國家強(qiáng)制標(biāo)準(zhǔn)。上海這一探索將在檢測與標(biāo)準(zhǔn)同步發(fā)展的新模式下,對生成式AI產(chǎn)業(yè)的規(guī)范與引領(lǐng)產(chǎn)生積極影響。
??給ChatGPT做測評,為AI系統(tǒng)“質(zhì)量保障”探路
??走進(jìn)上海市北高新區(qū)區(qū)塊鏈谷,籌建中的上海生成式人工智能質(zhì)檢中心里,一臺臺電腦中正奔跑著AI“體檢”軟件。
??今年,ChatGPT帶動了生成式人工智能應(yīng)用的火爆。我國迄今已推出上百個大模型,如何客觀地評價、比較大語言模型及其他AIGC模型的性能,成為大
模型應(yīng)用的關(guān)鍵一環(huán)。
??上海計算機(jī)軟件技術(shù)開發(fā)中心主任蔡立志介紹,軟件中心是上海科學(xué)院的直屬單位,作為一家長期以為網(wǎng)絡(luò)安全保駕護(hù)航為使命的研究機(jī)構(gòu),從2016年
起就關(guān)注人工智能的安全問題,迄今已開展了2000多項(xiàng)AI檢測業(yè)務(wù)。
??在多年技術(shù)與行業(yè)經(jīng)驗(yàn)積累的基礎(chǔ)上,經(jīng)過近兩年的準(zhǔn)備,上海市生成式人工智能質(zhì)檢中心于兩個月前在軟件中心正式掛牌批籌。“掛牌后不久,我們就
給ChatGPT做了一次測評。”上海計算機(jī)軟件技術(shù)開發(fā)中心軟件工程研究所副所長陳敏剛博士透露,測評的確可以對生成式語言大模型的推理、抗幻覺、理解
用戶意圖等能力,進(jìn)行客觀評價。
??蔡立志介紹,質(zhì)檢中心主要面向生成式人工智能所涉及的計算機(jī)視覺、自然語言處理、內(nèi)容生成等領(lǐng)域,聚焦人工智能生成內(nèi)容語義表達(dá)能力、邏輯推理
能力、合成內(nèi)容鑒別,以及功能、性能、安全性評估等,“通過提供全方位的測評服務(wù),以保障人工智能系統(tǒng)或應(yīng)用的質(zhì)量”。
??AI“體檢”火爆,“守底線”更要引領(lǐng)產(chǎn)業(yè)
??隨著大模型技術(shù)的快速進(jìn)步,在人工智能應(yīng)用不斷深入的同時,利用AI換臉、合成語音進(jìn)行傳播虛假信息、行騙等危害社會的現(xiàn)象也不斷發(fā)生。
??7月10日,國家網(wǎng)信辦等七部委聯(lián)合發(fā)文《生成式人工智能服務(wù)管理暫行辦法》,明確了AIGC服務(wù)提供者的責(zé)任,包括信息源可信責(zé)任、生成內(nèi)容合法合規(guī)
責(zé)任、申報安全評估及算法備案責(zé)任。
??“管理辦法的落地,需要專業(yè)的第三方機(jī)構(gòu)提供AI質(zhì)量檢驗(yàn)檢測服務(wù)。”蔡立志透露,質(zhì)檢中心去年籌建期間已完成300多個AI質(zhì)檢項(xiàng)目,“正式掛牌僅兩
個月,就已出具75份相關(guān)檢測報告”。
??由此可見,為AI做“體檢”的需求有多火爆。事實(shí)上,這項(xiàng)工作本身就是一項(xiàng)含金量極高的技術(shù)活兒。上海計算機(jī)軟件技術(shù)開發(fā)中心副主任宋俊典告訴記者,
對于一些大型復(fù)雜AI系統(tǒng)的檢測,甚至需要根據(jù)應(yīng)用場景專門搭建檢測檢驗(yàn)系統(tǒng),耗時可能長達(dá)半年,同時還需要研發(fā)大量相關(guān)技術(shù)與標(biāo)準(zhǔn)。近三年來,上海軟件
中心為上海乃至長三角地區(qū)人工智能企業(yè)與應(yīng)用方提供專業(yè)的第三方測評服務(wù)數(shù)年均超過500項(xiàng),累計發(fā)布AI檢測相關(guān)標(biāo)準(zhǔn)30余項(xiàng)。
??“對于AI的質(zhì)量檢測,只有好與差之分,沒有對與錯的判斷。”宋俊典解釋,通過質(zhì)檢,廠商能更清晰地了解AI軟件的性能,對產(chǎn)品的迭代與優(yōu)化更有針對性。
??檢測檢驗(yàn)是行業(yè)話語權(quán)的重要標(biāo)志,檢測標(biāo)準(zhǔn)往往是一個行業(yè)的發(fā)展風(fēng)向標(biāo)。然而,對于人工智能這個飛速發(fā)展的領(lǐng)域,蔡立志認(rèn)為,不能簡單套用傳統(tǒng)產(chǎn)業(yè)“
先立標(biāo)準(zhǔn)后檢測”的“守底線”模式,而應(yīng)采用檢測與標(biāo)準(zhǔn)同步發(fā)展的新型模式,以起到規(guī)范、引領(lǐng)產(chǎn)業(yè)的作用。
??據(jù)悉,目前AI檢測尚屬于企業(yè)自主行為,未來對于大模型的安全性、可解釋性、倫理風(fēng)險的檢測檢驗(yàn),可能會形成國家強(qiáng)制標(biāo)準(zhǔn)。(記者 許琦敏)