7月3日消息,昨日,“2023全球數(shù)字經(jīng)濟大會-人工智能高峰論壇”上,度小滿CTO許冬亮表示,“對比于通用大模型的能力而言,金融行業(yè)非常需要
垂直行業(yè)大模型”。
他談到,“在數(shù)據(jù)層面,金融行業(yè)因為安全及隱私保護要求數(shù)據(jù)大多存儲在本地,通用大模型在金融能力上缺乏必要的訓(xùn)練數(shù)據(jù)。另外一方面,金融行
業(yè)在風(fēng)控、精度等方面要求較高,系統(tǒng)又比較復(fù)雜,再加上金融相關(guān)數(shù)據(jù)實時性的要求很高,所以從這幾個維度去看,通用大模型的金融常識、生成的
可控性和準確性都達不到這個行業(yè)的最低要求,需要針對金融機構(gòu)定制的行業(yè)大模型去發(fā)揮效力”。
今年五月,度小滿宣布正式開源千億級中文金融大模型“軒轅”。軒轅大模型是在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來,在金融任務(wù)測試集中相
較于基座模型效果提升70%以上。
許冬亮認為,“軒轅”大模型運用獨創(chuàng)的hybrid-tuning方式,基于度小滿實際業(yè)務(wù)場景積累的海量金融數(shù)據(jù)進行訓(xùn)練,保證在提升金融能力的同時,不
會損失通用能力。
度小滿“軒轅”大模型在金融任務(wù)評測中,贏得了150次回答中63.33%的勝率。在通用能力評測中,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT 3.5, 61.22%的
任務(wù)表現(xiàn)與之持平,涉及數(shù)學(xué)計算、場景寫作、邏輯推理、文本摘要等13個主要維度。
許冬亮透露,“軒轅”大模型開源一個月的時間,已經(jīng)有上百家金融機構(gòu)在試用。他認為,行業(yè)大模型將幫助積極擁抱大模型的中小金融機構(gòu)縮小與頭部
機構(gòu)的技術(shù)差距。“金融行業(yè)有非常多的中小機構(gòu),它們的業(yè)務(wù)規(guī)模和科技能力都和頭部機構(gòu)有明顯差距,在大模型時代,所有金融機構(gòu)都能用先進的金
融大模型來解決自己的業(yè)務(wù)問題,大家重新站在同一起跑線上,這是中小機構(gòu)跨越‘?dāng)?shù)字鴻溝’和‘智能化鴻溝’的機遇”。(一橙)