“你好,歡迎來到北京冬奧會。”
話音剛落,便被轉(zhuǎn)換為英語、法語、日語等多種語言依次播報。走進(jìn)北京冬奧小屋,一位名叫“愛加”的虛擬主播已正式上崗,在智能語音識別技術(shù)的支持下,可將普通話實(shí)時翻譯成全世界多個語種,
讓奧運(yùn)聲音更快傳遍全球。
不只是虛擬主播,與試衣鏡融為一體的AI(人工智能)私教、幫助快遞小哥快速收派件的智能穿戴設(shè)備、能“聽懂”語音自行打字上網(wǎng)的鼠標(biāo)……
如今,越來越多智能語音技術(shù)從實(shí)驗(yàn)室走向終端應(yīng)用,走進(jìn)并服務(wù)人們的日常生活。
“作為軟件產(chǎn)業(yè)的重要組成部分,智能語音產(chǎn)業(yè)已步入快速發(fā)展的新階段。”在日前舉行的中國智能語音產(chǎn)業(yè)發(fā)展高峰論壇上,工信部信息技術(shù)發(fā)展司副司長王建偉介紹,近年來我國智能語音產(chǎn)業(yè)蓬勃發(fā)展,核心技術(shù)有所突破,目前語音識別準(zhǔn)確率已達(dá)到98%。
最新發(fā)布的《2020—2021中國語音產(chǎn)業(yè)發(fā)展白皮書》(以下簡稱《白皮書》)顯示,2020年我國智能語音市場規(guī)模達(dá)到217億元,同比增長31%,2021年可達(dá)到285億元,同比增長44%,
有力帶動產(chǎn)業(yè)數(shù)字化發(fā)展。“進(jìn)入萬物互聯(lián)時代,越來越多的智能設(shè)備需要在一定距離外操控,為智能語音產(chǎn)業(yè)帶來發(fā)展機(jī)遇。”中國語音產(chǎn)業(yè)聯(lián)盟理事長、科大訊飛董事長劉慶峰介紹,
語音交互賦能的智能設(shè)備正快速增長,以科大訊飛為例,2021年語音助手交互量同比增加84%。
隨著我國智能語音產(chǎn)業(yè)進(jìn)入規(guī)模化深耕期,如何加速關(guān)鍵技術(shù)研發(fā)和產(chǎn)業(yè)化,推動產(chǎn)業(yè)持續(xù)做大做強(qiáng),成為業(yè)界普遍關(guān)注的問題。
“當(dāng)下,智能語音技術(shù)發(fā)展面臨多語種語言互通、復(fù)雜場景人機(jī)交互和多模態(tài)虛擬世界三大挑戰(zhàn)。”劉慶峰分析,多語種不僅指國外語言也包括國內(nèi)方言;
復(fù)雜場景就是要在高噪音多人說話場景下做到精準(zhǔn)識別,今年訊飛產(chǎn)品識別率有望從69%提升至80%;多模態(tài)交互,就是要在語音中加入音色、語氣、表情、嘴型等因素,讓感知更智能。
《白皮書》指出,智能語音未來發(fā)展的關(guān)鍵創(chuàng)新點(diǎn),是無監(jiān)督學(xué)習(xí)、多模態(tài)融合、腦科學(xué)交叉融合創(chuàng)新等。目前在算法上,無監(jiān)督學(xué)習(xí)、低資源模型算法等需要突破。
此外,作為算力基礎(chǔ)的AI芯片領(lǐng)域,我國與國際先進(jìn)水平仍存在差距。
推動智能語音產(chǎn)業(yè)高質(zhì)量發(fā)展,下一步工信部將開展三方面工作。王建偉介紹,一是鼓勵地方加快制定有利于促進(jìn)智能語音技術(shù)與實(shí)體經(jīng)濟(jì)融合發(fā)展的產(chǎn)業(yè)政策。
二是鼓勵龍頭企業(yè)、科研機(jī)構(gòu)聯(lián)合開展技術(shù)攻關(guān),進(jìn)一步提升語音識別、合成、交互和語音芯片等技術(shù)水平,并建設(shè)國家級檢驗(yàn)檢測等公共服務(wù)平臺,為產(chǎn)業(yè)發(fā)展提供有力支撐。
目前,中國語音產(chǎn)業(yè)聯(lián)盟已吸引70多家產(chǎn)業(yè)鏈上下游擁有核心技術(shù)的企業(yè),未來還將再增加70家相關(guān)企業(yè),并鼓勵更多科研院校加入聯(lián)盟。三是不斷拓展應(yīng)用場景,加速語音技術(shù)在智能制造、智能家居、智慧醫(yī)療、教育養(yǎng)老等領(lǐng)域的融合應(yīng)用。