[發明專利]一種語音交互方法、裝置以及計算機可讀存儲介質在審
| 申請號: | 202011457154.5 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112637431A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 陳曉宇;楊超;張彬彬;李倩 | 申請(專利權)人: | 出門問問(蘇州)信息科技有限公司 |
| 主分類號: | H04M3/493 | 分類號: | H04M3/493;G10L13/02;G10L15/22;G10L15/26;G10L25/87 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 劉婧 |
| 地址: | 215000 江蘇省蘇州市蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 交互 方法 裝置 以及 計算機 可讀 存儲 介質 | ||
本發明公開了一種語音交互方法、裝置以及計算機可讀存儲介質,方法包括:接收IVR客戶端所發送的第一請求指令,以調用TTS模塊和ASR模塊;根據當前回復文本、語音識別信息或者用戶預設配置,確定當前運行模式為表征處于非打斷狀態的第一模式或者表征處于打斷狀態的第二模式;若判定為第一模式,則根據語音識別信息并在語音播報結束后反饋響應結果;若判定為第二模式,則根據語音識別信息并在語音播報未結束時反饋響應結果,并停止語音播報。實現了可在MRCP服務器設置打斷功能,并可根據實際需求通過當前回復文本、語音識別信息或者用戶預設配置來靈活地確定當前語音播報是否可打斷,可提升雙方之間的溝通效率,同時顯得對話更加智能化,提升用戶體驗感。
技術領域
本發明涉及智能交互領域,尤其涉及一種語音交互方法、裝置以及計算機可讀存儲介質。
背景技術
在智能電話系統中,包括IVR(Interactive Voice Response,互動式語音應答)客戶端和MRCP(Media Resource Control Protocol,媒體資源控制協議)服務器。
IVR客戶端在進行TTS播報的過程中,支持兩種模式,第一種是IVR客戶端未開啟打斷狀態,此時系統不監聽用戶側的講話,直到TTS(從文本到語音,Text To Speech)播報完成才進行ASR(Automatic Speech Recognition,自動語音識別技術)的監聽;第二種是IVR客戶端開啟打斷狀態,此時系統在TTS播報的同時調用ASR以監聽用戶的講話,如果接收到用戶的語音,則觸發打斷,停止TTS的播放。
可見,現有方案只能在IVR端單方面控制打斷功能,并且在第二種模式中一旦監聽到用戶的講話就打斷TTS的播放,整體不夠靈活,用戶體驗感不佳。
發明內容
本發明實施例提供了一種語音交互方法、裝置以及計算機可讀存儲介質,具有可在MRCP服務器設置打斷功能,并可根據實際需求通過當前回復文本、語音識別信息或者用戶預設配置來靈活地確定當前語音播報是否可打斷,以提升雙方之間的溝通效率以及用戶體驗感的技術效果。
本發明一方面提供一種語音交互方法,應用于媒體資源控制協議MRCP服務器,所述方法包括:接收互動式語音應答IVR客戶端所發送的第一請求指令,以調用文字轉語音TTS模塊和自動語音識別技術ASR模塊;其中,所述TTS模塊用于對當前回復文本向用戶進行語音播報,所述ASR模塊用于在所述TTS模塊語音播報的同時對所述用戶進行語音識別;根據所述當前回復文本、語音識別信息或者用戶預設配置,確定當前運行模式為表征處于非打斷狀態的第一模式或者表征處于打斷狀態的第二模式;若判定當前運作模式為所述第一模式,則根據語音識別信息并在所述TTS模塊語音播報結束后反饋響應結果;若判定當前運作模式為所述第二模式,則根據語音識別信息并在所述TTS模塊語音播報未結束時反饋響應結果,并停止語音播報。
在一可實施方式中,所述語音播報是否結束的判斷方式為:調用所述TTS模塊獲取對應于所述當前回復文本的語音播報時長;獲取所述ASR模塊識別開始時的起始時間戳;根據所述起始時間戳和語音播報時長,計算得到所述TTS模塊結束時的終止時間戳;根據所述終止時間戳,判斷所述TTS模塊是否語音播報結束。
在一可實施方式中,所述ASR模塊配置有預設識別時長;相應的,所述ASR模塊在對所述用戶進行語音識別的過程中,所述方法還包括:
若在語音播報過程中所述預設識別時長少于所述語音播報時長且判定所述語音識別信息為表征無意義的語音信息,則在所述ASR模塊語音識別結束時,重新調用所述ASR模塊對所述用戶進行語音識別。
在一可實施方式中,所述方法還包括:將所述ASR模塊所識別得到的語音信息按識別順序進行拼接,在所述TTS模塊語音播報結束后對拼接語音反饋響應結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于出門問問(蘇州)信息科技有限公司,未經出門問問(蘇州)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011457154.5/2.html,轉載請聲明來源鉆瓜專利網。





