[發明專利]一種語音識別引擎自動切換方法和裝置有效
| 申請號: | 201611226504.0 | 申請日: | 2016-12-27 |
| 公開(公告)號: | CN106710586B | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 原樹旗;雷宇 | 申請(專利權)人: | 北京儒博科技有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/18;G10L15/26;G10L21/0208 |
| 代理公司: | 北京衛平智業專利代理事務所(普通合伙) 11392 | 代理人: | 張新利 |
| 地址: | 101500 北京市密云區經濟開發*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 引擎 自動 切換 方法 裝置 | ||
一種語音識別引擎自動切換方法和裝置,該方法包括:采集用戶輸入的第一音頻信號,并對第一音頻信號進行處理;對處理后的第一音頻信號進行語音識別,得到對應的語音文本;對語音文本進行語義分析,確定用戶對應的語種傾向;根據語種傾向進行語音識別引擎切換,以對后續的第二音頻信號進行語音識別。該方法能夠根據用戶的語種傾向實現各語音識別引擎之間的自動切換。
技術領域
本公開涉及語音識別領域,特別涉及一種語音識別引擎自動切換方法和裝置。
背景技術
語音識別是實現人工智能的基礎,很多機器人、物聯網、移動智能終端都采用語音作為交互入口。語音識別引擎采集客戶端的音頻信號,然后將其送至語音識別引擎進行音頻信號的識別和分析,最后將音頻信號轉換成文文信息,實現語音識別的目的。目前大多數語音識別系統采用單引擎工作模式,即工作時只能識別一種語言,例如科大訊飛的靈犀只能識別中文,如果用戶對靈犀說英文,則無法被正確識別。這導致語音識別系統僅適用于單語種的語言環境。
發明內容
本發明的目的是提供一種語音識別引擎自動切換方法,該方法能夠克服現有語音識別系統只能實現一種語言識別的缺陷。
相應的,本發明實施例還提供一種語音識別引擎自動切換裝置,用以保證上述方法的實現及應用。
為了解決上述問題,本發明實施例公開了一種語音識別引擎自動切換方法,包括:
采集用戶輸入的第一音頻信號,并對所述第一音頻信號進行處理;
對處理后的第一音頻信號進行語音識別,得到對應的語音文本;
對所述語音文本進行語義分析,確定用戶對應的語種傾向;
根據所述語種傾向進行語音識別引擎切換,以對后續的第二音頻信號進行語音識別。
優選地,對所述第一音頻信號進行處理包括對所述第一音頻信號進行降噪和消回聲處理。
優選地,所述第一音頻信號包括多路音頻信號,對所述音頻信號進行處理包括:
對所述多路音頻信號分別進行比較,選擇強度最大的一路音頻信號進行降噪和消回聲處理。
優選地,所述對所述語音文本進行語義分析時,
對所述語音文本進行句法分析,標注所述語音文本中的語法成分;
將所述語法成分與意圖庫進行匹配,從而確定當前用戶對應的語種傾向,所述意圖庫用于輸出采用對應語種的概率。
優選地,所述意圖庫包括分別與不同應用場景對應的多個意圖庫,每個意圖庫分別用于輸出所在應用場景下采用對應語種的概率。
優選地,所述語音識別引擎自動切換方法還包括:
將所述語法成分與意圖庫進行匹配,從而確定當前用戶對應的應用場景,所述意圖庫用于輸出與所述應用場景關聯的概率。
本發明另一方面提供一種語音識別引擎自動切換裝置,包括:
音頻信號采集處理模塊,用于采集用戶輸入的第一音頻信號,并對所述第一音頻信號進行處理;
語音識別模塊,用于對處理后的第一音頻信號進行語音識別,得到對應的語音文本;
語義分析模塊,用于對所述語音文本進行語義分析,確定用戶對應的語種傾向;
切換模塊,用于根據所述語種傾向進行語音識別引擎切換,以對后續的第二音頻信號進行語音識別。
優選地,對所述第一音頻信號進行處理包括對所述第一音頻信號進行降噪和消回聲處理。
優選地,所述第一音頻信號包括多路音頻信號,對所述音頻信號進行處理包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京儒博科技有限公司,未經北京儒博科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611226504.0/2.html,轉載請聲明來源鉆瓜專利網。





