12月11日,訊飛科大訊飛董事長劉慶峰在2022中國移動全球合作伙伴大會主論壇發(fā)表《AI賦能數(shù)智創(chuàng)新》線上主題演講。劉慶劉慶峰表示,峰人數(shù)字經(jīng)濟是工智全球經(jīng)濟復(fù)蘇的關(guān)鍵動力,人工智能是賦能數(shù)數(shù)字經(jīng)濟下一步發(fā)展的核心引擎。他認(rèn)為,字經(jīng)展源頭技術(shù)的核心持續(xù)創(chuàng)新,是引擎引領(lǐng)人工智能發(fā)展的必選之路。人工智能解決重大社會命題,訊飛需要堅持源頭核心技術(shù)的劉慶持續(xù)創(chuàng)新,在單點技術(shù)持續(xù)突破的峰人基礎(chǔ)上,加強多項技術(shù)深度融合,工智比如科大訊飛在多模感知、賦能數(shù)多維表達(dá)、字經(jīng)展深度理解和運動智能四方面的核心關(guān)鍵技術(shù)的突破和系統(tǒng)性的創(chuàng)新。
據(jù)介紹,多模感知不只有語音的感知,還要有視覺、眼神、面部表情、肢體語言、環(huán)境的綜合感知,包括味覺、觸覺等等。科大訊飛推出可以將唇形和語音技術(shù)相融合的多模態(tài)語音交互系統(tǒng),讓語音識別在高噪音場景下得到了實用。比如地鐵站買票的場景,除了用戶自己的聲音外,周圍人說的話也會被機器捕捉到。那么,想要從嘈雜背景環(huán)境中分離干凈人聲,除了必需的語音識別技術(shù)外,還可以結(jié)合嘴型等圖像識別技術(shù)。同時,科大訊飛還推出了凌空手寫、眼神打字等功能,都可以實現(xiàn)在虛擬世界和元宇宙中進行更自然地溝通和交流。
多維表達(dá)可以把文字內(nèi)容配上圖片、虛擬形象和語音,用更立體的方式對外表達(dá)。比如AI讀朱自清的散文時,就可以生成朱自清的形象;讀林徽因的散文時,就可以生成林徽因的形象。有了這樣強大的多維表達(dá)功能,根據(jù)文章的進度,隨時隨地都可以配上AI生成的畫面,既生動又有趣。
過去一年科大訊飛把AI的深度理解能力和認(rèn)知能力提升到了全新的高度。在權(quán)威的知識推理比賽OpenBookQA上,科大訊飛的AI在單模型上已經(jīng)首次超過人類水平,這標(biāo)志著AI認(rèn)知智能的重大突破,從而使得機器可以在越來越多的領(lǐng)域幫助人們解決更專業(yè)和復(fù)雜的問題。
運動智能是把多模感知、多維表達(dá)和深度理解結(jié)合在具體的機器人、機器狗、玩具等形象上面,從而在現(xiàn)實世界為人類提供更大幫助。近期發(fā)布的訊飛運動機器人,強大的運動能力讓人眼前一亮。
劉慶峰表示,以上這些都是科大訊飛承建的語音及語言國家工程技術(shù)中心和認(rèn)知智能全國重點實驗室的最新成果。
此外,要滿足未來社會事業(yè)、人類發(fā)展的剛性需求,需要懂知識、善學(xué)習(xí)、能進化的機器人。科大訊飛在今年年初提出了訊飛超腦2030計劃,希望讓懂知識、善學(xué)習(xí)、能進化的機器人,無論是虛擬形象的機器人還是實體機器人,未來能夠走進每一個家庭。在人口老齡化的大背景下,訊飛超腦2030計劃具有非常重要的產(chǎn)業(yè)意義和社會意義。劉慶峰還提到,未來老人或許可以穿上外骨骼機器人,跑步不會摔跤,搬東西不會扭傷胳膊,可以像年輕人一樣登山。
責(zé)任編輯:徐恒