“蘇州街站到了,思必上線請帶好隨身物品準(zhǔn)備下車。技術(shù)”
“巴溝站到了,語音請帶好隨身物品準(zhǔn)備下車。編輯”
——地鐵語音播報編輯站名
隨著人工智能技術(shù)的思必上線發(fā)展,智能語音已融入我們?nèi)粘I畹募夹g(shù)方方面面。在人機共生的語音智能時代,讓人機交互更自然、編輯更流暢一直是思必上線人類不斷探索的目標(biāo)。
近期,技術(shù)思必馳TTS技術(shù)上線語音編輯功能。語音語音編輯,編輯即在一段語音中間插入語音內(nèi)容,思必上線或根據(jù)之前的技術(shù)語音風(fēng)格續(xù)寫,使得插入或續(xù)寫的語音語音內(nèi)容與之前的語音風(fēng)格完美融合,帶給用戶更自然、流暢的語音服務(wù)體驗。該技術(shù)可應(yīng)用于自媒體語音修正,軌交、電商、快遞、銀行等行業(yè)中的智能客服語音播報場景,目前,思必馳語音編輯支持中文語音編輯及英文語音編輯。
語音編輯,像文本一樣修改音頻
點擊下方音頻,感受思必馳優(yōu)化后的語音編輯效果
普通語音編輯,手機號部分能聽出明顯差異
思必馳語音編輯,手機號部分與原有音頻自然融合
日常生活中,如音頻中所展示的智能客服已被廣泛應(yīng)用于快遞、銀行、電商等行業(yè)場景中,為行業(yè)降本增效帶來顯著作用。廠商通過語音編輯技術(shù),僅需對固定話術(shù)中的人名、數(shù)字等變量進(jìn)行替換,便可獲得針對不同用戶的差異性播報語音,批量通知用戶,大大提高了生產(chǎn)效率。
在語音編輯過程中,最大的挑戰(zhàn)就是如何使得編輯后的語音接近原有音頻的自然和流暢。情感的細(xì)微差別、語調(diào)變化、節(jié)奏等稍有不連貫,聽眾便能從中聽出明顯的語音差異。因此,為了讓此類編輯后的語音播報更自然,人類不斷優(yōu)化語音合成技術(shù)水平。
點擊試聽思必馳語音編輯續(xù)寫后的文本
原有音頻風(fēng)格
后半句為根據(jù)原有音頻風(fēng)格進(jìn)行編輯續(xù)寫
思必馳對語音編輯技術(shù)優(yōu)化更新,應(yīng)用深度合成技術(shù),基于大模型實現(xiàn)零樣本高質(zhì)量語音編輯,可對中英文語音進(jìn)行插入文本、根據(jù)之前風(fēng)格續(xù)寫等操作。經(jīng)思必馳語音編輯后的語音更流暢、更自然,帶給用戶媲美原聲的聽覺體驗。
適用各種場景,音頻創(chuàng)作更高效
目前,語音編輯已經(jīng)應(yīng)用于快遞、電商、銀行等場景的智能客服以及自媒體短視頻配音修正中,為各行各業(yè)帶來更自然的語音服務(wù)。
智能客服固定話術(shù)修改變量
在快遞、電商、銀行、軌交等場景的智能客服中,常常需要用到固定話術(shù),但與用戶通話時,固定話術(shù)需要根據(jù)不同用戶、場景對其中的變量進(jìn)行修改。如:
應(yīng)用場景
·張先生您好,請到樓下憑取件碼123取件;
·王女士您好,您近日在我店鋪購買的商品,如果滿意請給5分好評;
·劉先生您好,您的信用卡還款日為8月15日,請記得及時還款;
·蘇州街站到了,請帶好隨身物品準(zhǔn)備下車;
·北京,天氣晴轉(zhuǎn)多云,氣溫25-30℃。
在此類語音播報中,應(yīng)用思必馳語音編輯技術(shù),可對固定話術(shù)中的人名、地名、數(shù)字、日期等變量進(jìn)行編輯,從而快速獲得接近原聲的語音,滿足不同用戶、場景需求。
短視頻修正錄音口誤
修正前音頻
修正內(nèi)容后音頻
短視頻博主在視頻創(chuàng)作過程中,視頻素材往往有口誤、詞不達(dá)意或冗余的內(nèi)容,此時,重新對某一句話進(jìn)行配音,則很難還原當(dāng)時的環(huán)境音,出現(xiàn)該句配音與其他音頻存在些許差異的情況。如果對視頻一幀一幀進(jìn)行修改,則需要花費大量時間。在修改音頻時,使用思必馳語音編輯技術(shù),可對個別字詞及冗余內(nèi)容進(jìn)行替換,替換后的字詞可完美融入之前的語音環(huán)境,降低語音編輯前后的差異性,獲得更自然、流暢的語音。
為了保證語音編輯技術(shù)合法使用,思必馳可通過聲紋識別對用戶上傳的公眾人物、敏感話題等音頻進(jìn)行屏蔽,拒絕編輯合成,保證技術(shù)安全。
除語音編輯外,思必馳聲音復(fù)刻、本地合成、情感音色合成等多項語音合成技術(shù)都迎來更新,敬請期待!
未來,思必馳將基于DFM-2大模型,結(jié)合語音合成技術(shù)進(jìn)行技術(shù)聯(lián)動,為智能汽車、智能家居、消費電子,以及金融、軌交、政務(wù)等數(shù)字政企行業(yè)場景客戶帶來更加自然、流暢的語音交互服務(wù)。
審核編輯:彭菁