[發(fā)明專利]外呼語音輸出方法、裝置及設(shè)備在審
| 申請?zhí)枺?/td> | 202011608326.4 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112735372A | 公開(公告)日: | 2021-04-30 |
| 發(fā)明(設(shè)計)人: | 簡仁賢;鄧茜;王海 | 申請(專利權(quán))人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;H04M3/42 |
| 代理公司: | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) 31243 | 代理人: | 王奎宇;邵棟 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 呼語 輸出 方法 裝置 設(shè)備 | ||
本申請?zhí)峁┝艘环N外呼語音輸出方法、裝置及設(shè)備,該方案能夠通過可變話術(shù)子句中可變話術(shù)槽位的內(nèi)容靈活適應(yīng)不同外呼任務(wù)中的變量,如不同的呼叫對象、地址等,預(yù)先生成的語音文件能夠覆蓋實際外呼場景中外呼出話語句的大部分內(nèi)容。因此可以預(yù)生成外呼出話語句中大部分內(nèi)容的語音文件,并在在需要時直接調(diào)取輸出即可,有效提高了出話速度,并且適用場景靈活,可以避免出現(xiàn)語音播報卡頓的情況。
技術(shù)領(lǐng)域
本申請涉及信息技術(shù)領(lǐng)域,尤其涉及一種外呼語音輸出方法、裝置及設(shè)備。
背景技術(shù)
隨著人工智能算法的發(fā)展,智能外呼系統(tǒng)也被越來越多的呼叫中心所采用。但是,目前智能外呼系統(tǒng)還面臨一系列難題,如:語音識別不準(zhǔn)確,人機(jī)對話時出話速度慢等。其中,對話時出話速度慢這個問題給用戶帶來了非常不好的使用體驗,各大智能外呼系統(tǒng)的廠家運(yùn)用了不同的方法去解決這個問題:如,在TTS(Text To Speech,文本轉(zhuǎn)語音)服務(wù)中加入語音緩存,對于完全一樣的文本內(nèi)容,直接用緩存而非實時生成;在實時生成語音文件時采用分段生成的方案,按標(biāo)點符號對外呼出話語句切分后,調(diào)用TTS服務(wù)先生成第一段子句的語音文件進(jìn)行播放,然后在播放的同時調(diào)用TTS服務(wù)生成第后續(xù)子句的語音文件,依次播放。
上述的方法能夠解決一部分問題,但仍然會有各自的缺陷。如使用TTS語音緩存的方案雖然能解決部分語句的出話速度問題,但是由于實際的智能外呼系統(tǒng)在進(jìn)行呼叫時,一般需要對不同的呼叫人設(shè)置不同的外呼出話語句。而在進(jìn)行緩存時難以窮舉所有情況下可能輸出的外呼出話語句,因此在實際場景中,TTS語音緩存技術(shù)適用場景不夠靈活,無法難以解決上述問題。
如果使用語音分段合成技術(shù),確實能加快一些出話速度。但是,由于是以標(biāo)點符號對外呼出話語句進(jìn)行拆分,會導(dǎo)致出話速度完全依賴標(biāo)點的斷句位置,容易出現(xiàn)某一些子句的過長的情況。如果碰到第一段子句的文本內(nèi)容很長時,仍然會導(dǎo)致出話速度較慢,而碰到中間子句的文本內(nèi)容很長時,則會出現(xiàn)前一個子句的語音已經(jīng)播放完畢,而后一個子句仍然未生成語音的情況,從而給接聽用戶的感覺是語音播報卡頓。
由此可知,目前智能外呼系統(tǒng)中所采用的方案無法很好的解決出話速度較慢的問題。
發(fā)明內(nèi)容
本申請的一個目的是提供一種外呼語音輸出方案,用以解決外呼系統(tǒng)出話速度慢的問題。
為實現(xiàn)上述目的,本申請?zhí)峁┝艘环N外呼語音輸出方法,該方法包括:
獲取外呼出話語句中的固定話術(shù)子句和可變話術(shù)子句,并調(diào)用文本轉(zhuǎn)語音服務(wù)生成所述固定話術(shù)子句的第一語音文件,其中,所述可變話術(shù)子句包括可變話術(shù)槽位;
根據(jù)外呼任務(wù)的變量信息確定所述可變話術(shù)子句中可變話術(shù)槽位的內(nèi)容,調(diào)用文本轉(zhuǎn)語音服務(wù)生成所述可變話術(shù)子句的第二語音文件;
根據(jù)所述第一語音文件和/或第二語音文件拼接獲得外呼出話語句對應(yīng)的預(yù)生成語音文件;
根據(jù)所述外呼任務(wù)對應(yīng)的目標(biāo)外呼出話語句調(diào)取并輸出所述預(yù)生成語音文件。
本申請還提供了一種外呼語音輸出裝置,該裝置包括:
話術(shù)獲取模塊,用于獲取外呼出話語句中的固定話術(shù)子句和可變話術(shù)子句,其中,所述可變話術(shù)子句包括可變話術(shù)槽位;
語音預(yù)生成模塊,用于調(diào)用文本轉(zhuǎn)語音服務(wù)生成所述固定話術(shù)子句的第一語音文件,以及根據(jù)外呼任務(wù)的變量信息確定所述可變話術(shù)子句中可變話術(shù)槽位的內(nèi)容,調(diào)用文本轉(zhuǎn)語音服務(wù)生成所述可變話術(shù)子句的第二語音文件;
語音拼接模塊,用于根據(jù)所述第一語音文件和/或第二語音文件拼接獲得外呼出話語句對應(yīng)的預(yù)生成語音文件;
語音輸出模塊,用于根據(jù)所述外呼任務(wù)對應(yīng)的目標(biāo)外呼出話語句調(diào)取并輸出所述預(yù)生成語音文件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于竹間智能科技(上海)有限公司,未經(jīng)竹間智能科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011608326.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





