[發(fā)明專利]語音交互方法、服務(wù)器、語音交互系統(tǒng)和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110689953.3 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113421542A | 公開(公告)日: | 2021-09-21 |
| 發(fā)明(設(shè)計)人: | 郭華鵬;張巖 | 申請(專利權(quán))人: | 廣州小鵬汽車科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/04;H04L29/08 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 邵泳城 |
| 地址: | 510640 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 交互 方法 服務(wù)器 系統(tǒng) 存儲 介質(zhì) | ||
本發(fā)明公開一種語音交互方法、服務(wù)器、語音交互系統(tǒng)以及存儲介質(zhì)。語音交互方法包括:獲取TTS的合成請求;根據(jù)TTS的合成請求,在服務(wù)器的第一緩存中查找與TTS的合成請求相應(yīng)的目標(biāo)音頻文件;在第一緩存中不存在目標(biāo)音頻文件時,在服務(wù)器的第二緩存中查找與TTS的合成請求相應(yīng)的目標(biāo)音頻文件;在第二緩存中不存在目標(biāo)音頻文件時,使用第三方服務(wù)合成目標(biāo)音頻文件,并返回給車機(jī)端以完成語音交互。上述語音交互方法通過先在服務(wù)器本地查找能夠較快響應(yīng)的第一緩存和第二緩存,達(dá)到更快獲得目標(biāo)音頻文件的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及語音技術(shù)領(lǐng)域,特別涉及一種語音交互方法、服務(wù)器、語音交互系統(tǒng)和存儲介質(zhì)。
背景技術(shù)
由于用戶用車習(xí)慣不同,每個車機(jī)常用的回復(fù)指令也是大不一樣,單一的緩存有失效、丟失風(fēng)險,造成請求第三方服務(wù)流量大,音頻播報延時較高,影響人機(jī)交互體感,而且,頻繁使用第三方服務(wù),會使得成本增加。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施方式提供一種語音交互方法、服務(wù)器、語音交互系統(tǒng)和存儲介質(zhì)。
本發(fā)明實(shí)施方式的一種語音交互方法,包括:
獲取TTS的合成請求;
根據(jù)所述TTS的合成請求,在所述服務(wù)器的第一緩存中查找與所述TTS的合成請求相應(yīng)的目標(biāo)音頻文件;
在所述第一緩存中不存在所述目標(biāo)音頻文件時,在所述服務(wù)器的第二緩存中查找與所述TTS的合成請求相應(yīng)的所述目標(biāo)音頻文件;
在所述第二緩存中不存在所述目標(biāo)音頻文件時,使用第三方服務(wù)合成所述目標(biāo)音頻文件,并返回給車機(jī)端以完成語音交互。
在某些實(shí)施方式中,所述語音交互方法包括:
根據(jù)一定時間內(nèi)各所述TTS的合成請求的文本內(nèi)容以及各所述TTS的合成請求出現(xiàn)的次數(shù),獲取存量數(shù)據(jù);
根據(jù)所述存量數(shù)據(jù),使用所述第三方服務(wù)預(yù)合成音頻流存儲至所述第一緩存,以獲得所述第一緩存的預(yù)置音頻文件數(shù)據(jù),和/或
根據(jù)所述存量數(shù)據(jù),使用所述第三方服務(wù)預(yù)合成音頻流存儲至所述第二緩存,以獲得所述第二緩存的預(yù)置音頻文件數(shù)據(jù)
在某些實(shí)施方式中,所述語音交互方法包括:
在所述第一緩存不存在所述目標(biāo)音頻文件時,將所述第三方服務(wù)在線合成的所述目標(biāo)音頻文件存儲至所述第一緩存,和/或
在所述第二緩存不存在所述目標(biāo)音頻文件時,將所述第三方服務(wù)在線合成的所述目標(biāo)音頻文件存儲至所述第二緩存。
在某些實(shí)施方式中,所述語音交互方法包括:
通過開關(guān)控制是否將音頻文件存儲至所述第一緩存,和/或是否將音頻文件存儲至所述第二緩存。
在某些實(shí)施方式中,所述語音交互方法包括:
查找所述存量數(shù)據(jù)中包含預(yù)設(shè)關(guān)鍵字的TTS的合成請求,使用所述第三方服務(wù)合成與查找到的TTS的合成請求相應(yīng)的音頻流,并存儲至所述第一緩存,以更新所述第一緩存的預(yù)置音頻文件數(shù)據(jù),和/或
查找所述存量數(shù)據(jù)中包含預(yù)設(shè)關(guān)鍵字的TTS的合成請求,使用所述第三方服務(wù)合成與查找到的TTS的合成請求相應(yīng)的音頻流存儲至所述第二緩存,以更新所述第二緩存的預(yù)置音頻文件數(shù)據(jù)。
在某些實(shí)施方式中,所述語音交互方法包括:
在所述第一緩存滿足預(yù)設(shè)條件時,執(zhí)行音頻文件的緩存淘汰策略。
在某些實(shí)施方式中,所述執(zhí)行緩存淘汰策略,包括:
根據(jù)最近最少使用原則和預(yù)設(shè)過期時間,對所述音頻文件執(zhí)行緩存淘汰策略。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州小鵬汽車科技有限公司,未經(jīng)廣州小鵬汽車科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110689953.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





