[發明專利]一種語音交互方法及設備在審
| 申請號: | 202011244729.5 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112382280A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 劉洋宇;黃安子;張云翔;饒竹一;李智誠 | 申請(專利權)人: | 深圳供電局有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/22;G10L15/26;G10L21/0208;H04R1/40;H04R3/00 |
| 代理公司: | 深圳匯智容達專利商標事務所(普通合伙) 44238 | 代理人: | 孫威 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 交互 方法 設備 | ||
1.一種語音交互方法,其特征在于,包括以下步驟:
獲取使用者對語音交互設備進行喚醒的命令;
對使用者的喚醒命令進行定向拾音、遠場降噪及回音消除,以減少語音識別誤差;
根據獲取的使用者對語音交互設備進行喚醒命令的前后數據信息,對語音信息進行糾錯,獲取包含有使用者意圖的信息文本;
根據所述信息文本,對用戶進行反饋。
2.根據權利要求1所述的語音交互方法,其特征在于,所述對使用者的喚醒命令進行定向拾音、遠場降噪及回音消除,以減少語音識別誤差的步驟包括以下:
根據雙向循環神經網絡模型、卷積神經網絡模型和/或端到端神經網絡模型,并結合句式數據,通過底層句子語義建模的方式進行語義糾錯,以避免由于用戶意圖理解失準或內容噪音所引起的系統響應偏差的步驟。
3.根據權利要求1或2所述的語音交互方法,其特征在于,所述對使用者的喚醒命令進行定向拾音的步驟包括:
通過多麥克風陣列硬件以及相應的聲源定位和波束形成,計算聲源距離麥克風陣列的角度和距離,實現對目標聲源的跟蹤,同時在期望聲源方向上有效地形成一個波束,僅拾取波束內的信號,從而達到同時提取聲源和抑制噪聲的步驟。
4.根據權利要求1或2所述的語音交互方法,其特征在于,所述遠場降噪及回音消除的步驟包括:通過自適應濾波器消除掉揚聲器與麥克風之間的耦合,從而提升拾音得到語音的質量,端點檢測技術監測有效人聲、過濾一些非人聲的步驟。
5.根據權利要求1或2所述的語音交互方法,其特征在于,所述根據所述信息文本,對用戶進行反饋的步驟包括:
采用拼接語音合成和/或波形建模語音合成的步驟。
6.根據權利要求5所述的語音交互方法,其特征在于,采用拼接語音合成的步驟包括通過受限領域固定文本格式的模板進行合成的步驟;采用波形建模語音合成的步驟包括通過動態變化部分內容進行合成的步驟。
7.一種語音交互設備,其特征在于,包括:
語音輸入模塊、語音識別模塊、主控制器、控制模塊、外部存儲器以及語音輸出模塊,其中:
所述語音輸入模塊對使用者的喚醒命令進行定向拾音、遠場降噪及回音消除,以減少語音識別誤差;
所述語音輸入模塊與所述語音識別模塊信號連接,所述語音識別模塊通過信號線分別與所述外部存儲器和所述語音輸出模塊信號連接,所述外部存儲器與一上位機信號連接,所述語音識別模塊通過信號線與所述主控制器信號連接,所述主控制器通過信號線與所述外部存儲器信號連接,所述主控制器通過信號線與所述控制模塊信號連接。
8.根據權利要求7所述的語音交互設備,其特征在于,所述外部存儲器在設備運行過程中通過串口將數據發往所述主控模塊,所述主控模塊將數據轉存至外部存儲器進行存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳供電局有限公司,未經深圳供電局有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011244729.5/1.html,轉載請聲明來源鉆瓜專利網。





