[發明專利]一種語音交互方法、裝置以及計算機可讀存儲介質在審
| 申請號: | 202011457154.5 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112637431A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 陳曉宇;楊超;張彬彬;李倩 | 申請(專利權)人: | 出門問問(蘇州)信息科技有限公司 |
| 主分類號: | H04M3/493 | 分類號: | H04M3/493;G10L13/02;G10L15/22;G10L15/26;G10L25/87 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 劉婧 |
| 地址: | 215000 江蘇省蘇州市蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 交互 方法 裝置 以及 計算機 可讀 存儲 介質 | ||
1.一種語音交互方法,應用于媒體資源控制協議MRCP服務器,其特征在于,所述方法包括:
接收互動式語音應答IVR客戶端所發送的第一請求指令,以調用文字轉語音TTS模塊和自動語音識別技術ASR模塊;其中,所述TTS模塊用于對當前回復文本向用戶進行語音播報,所述ASR模塊用于在所述TTS模塊語音播報的同時對所述用戶進行語音識別;
根據所述當前回復文本、語音識別信息或者用戶預設配置,確定當前運行模式為表征處于非打斷狀態的第一模式或者表征處于打斷狀態的第二模式;
若判定當前運作模式為所述第一模式,則根據語音識別信息并在所述TTS模塊語音播報結束后反饋響應結果;
若判定當前運作模式為所述第二模式,則根據語音識別信息并在所述TTS模塊語音播報未結束時反饋響應結果,并停止語音播報。
2.根據權利要求1所述的方法,其特征在于,所述語音播報是否結束的判斷方式為:
調用所述TTS模塊獲取對應于所述當前回復文本的語音播報時長;
獲取所述ASR模塊識別開始時的起始時間戳;
根據所述起始時間戳和語音播報時長,計算得到所述TTS模塊結束時的終止時間戳;
根據所述終止時間戳,判斷所述TTS模塊是否語音播報結束。
3.根據權利要求2所述的方法,其特征在于,所述ASR模塊配置有預設識別時長;
相應的,所述ASR模塊在對所述用戶進行語音識別的過程中,所述方法還包括:
若在語音播報過程中所述預設識別時長少于所述語音播報時長且判定所述語音識別信息為表征無意義的語音信息,則在所述ASR模塊語音識別結束時,重新調用所述ASR模塊對所述用戶進行語音識別。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
將所述ASR模塊所識別得到的語音信息按識別順序進行拼接,在所述TTS模塊語音播報結束后對拼接語音反饋響應結果。
5.一種語音交互方法,應用于互動式語音應答IVR客戶端,其特征在于,所述方法包括:
向媒體資源控制協議MRCP服務器發送第二請求指令,以通過所述MRCP服務器調用文字轉語音TTS模塊和自動語音識別技術ASR模塊;其中,所述TTS模塊用于對當前回復文本向用戶進行語音播報,所述ASR模塊用于在所述TTS模塊語音播報的同時對所述用戶進行語音識別;
指示所述MRCP服務器根據所述當前回復文本、語音識別信息或者用戶預設配置,確定當前運行模式為表征處于非打斷狀態的第一模式或者表征處于打斷狀態的第二模式;
若所述MRCP服務器判定當前運作模式為所述第一模式,則根據語音識別信息并在所述TTS模塊語音播報結束后反饋響應結果;
若所述MRCP服務器判定當前運作模式為所述第二模式,則根據語音識別信息并在所述TTS模塊語音播報未結束時反饋響應結果,并停止語音播報。
6.根據權利要求5所述的方法,其特征在于,所述語音播報是否結束的判斷方式為:
調用所述TTS模塊獲取對應于所述當前回復文本的語音播報時長;
獲取所述ASR模塊識別開始時的起始時間戳;
根據所述起始時間戳和語音播報時長,計算得到所述TTS模塊結束時的終止時間戳;
根據所述終止時間戳,判斷所述TTS模塊是否語音播報結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于出門問問(蘇州)信息科技有限公司,未經出門問問(蘇州)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011457154.5/1.html,轉載請聲明來源鉆瓜專利網。





