[發明專利]基于語音通話的語音交互方法、裝置、設備和存儲介質有效
| 申請號: | 202011394998.X | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112201222B | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 劉彥華;鄧銳濤;劉云峰 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G10L13/033 | 分類號: | G10L13/033;G10L13/04;G10L15/22;H04M3/527 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 黃晶晶 |
| 地址: | 518051 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 通話 交互 方法 裝置 設備 存儲 介質 | ||
本申請提供了一種基于語音通話的語音交互方法、裝置、設備和存儲介質。該方法包括:在語音機器人與用戶終端的語音通話交互過程中,接收所述用戶終端發送的語音流片段;對所述語音流片段進行意圖識別,得到所述語音流片段所表達的用戶意圖;若所述用戶意圖的意圖類型包括語音播放參數調整意圖,則按照語音播放參數調整意圖,調整語音機器人的語音播放參數的參數值;按照所述語音播放參數的調整后的參數值,對所述語音機器人所對應的交互信息進行語音合成,生成交互語音;控制所述語音機器人,向所述用戶終端輸出所述交互語音。本申請的方案能夠提高語音交互質量。
技術領域
本申請涉及人工智能技術領域和語音通話技術領域,特別是涉及一種基于語音通話的語音交互方法、裝置、設備和存儲介質。
背景技術
隨著人工智能技術的發展,出現了很多機器人替代人工的場景。語音機器人,則為一種常用的智能機器人,能夠代替人工客服與用戶進行通話,從而執行部分客服事務。比如,使用語音機器人進行外呼通話屬于較為常見的場景。外呼通話,即指通過語音機器人主動呼叫用戶,建立語音通話。
傳統方法中,語音機器人只會按照預設的固定語音播放參數與用戶進行語音交互應答,然后,使用固定語音播放參數進行交互應答過于局限,不適用于很多場景,從而,影響語音通話中的語音交互質量。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠避免響應不靈活的基于語音通話的語音交互方法、裝置、計算機設備和存儲介質。
一種基于語音通話的語音交互方法,所述方法包括:
在語音機器人與用戶終端的語音通話交互過程中,接收所述用戶終端發送的語音流片段;
對所述語音流片段進行意圖識別,得到所述語音流片段所表達的用戶意圖;
若所述用戶意圖的意圖類型包括語音播放參數調整意圖,則
按照語音播放參數調整意圖,調整語音機器人的語音播放參數的參數值;
按照所述語音播放參數的調整后的參數值,對所述語音機器人所對應的交互信息進行語音合成,生成交互語音;
控制所述語音機器人,向所述用戶終端輸出所述交互語音。
在其中一個實施例中,所述對所述語音流片段進行意圖識別,得到所述語音流片段所表達的用戶意圖,包括:
對所述語音流片段進行語音識別,得到相應的文本信息;
對所述文本信息進行上下文語義理解和意圖識別,得到所述語音流片段對應的用戶意圖。
在其中一個實施例中,所述按照語音播放參數調整意圖,調整語音機器人的語音播放參數的參數值,包括:
從所述語音播放參數調整意圖中,識別所指定調整的語音播放參數以及所述語音播放參數所對應的調整方向;
獲取所述語音播放參數所對應的參數區間;
根據所述語音播放參數當前的參數值和所述參數區間,確定與所述語音播放參數對應的調節幅度;
將所述當前的參數值按所述調整方向和所述調節幅度進行調整;其中,調整后的參數值,位于所述參數區間之內。
在其中一個實施例中,指定調整的所述語音播放參數,包括音量參數和語速參數中的至少一種;
所述將所述當前的參數值按所述調整方向和所述調節幅度進行調整,包括:
若指定調整的所述語音播放參數包括音量參數,則
將所述音量參數當前的音量值,按照音量調整方向和音量調節幅度進行調整;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011394998.X/2.html,轉載請聲明來源鉆瓜專利網。





