[發明專利]一種語音識別系統和方法在審
| 申請號: | 201810758940.5 | 申請日: | 2018-07-11 |
| 公開(公告)號: | CN109036431A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 余啟洪;柳青;宋征軒;張海龍 | 申請(專利權)人: | 北京智能管家科技有限公司 |
| 主分類號: | G10L15/34 | 分類號: | G10L15/34;G10L15/26;H04L29/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 101500 北京市密云區經濟開發*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 處理模塊 引擎 調度模塊 引擎資源 語音識別系統 目標引擎 語音識別 語音數據 語音識別引擎 復雜設計 空閑狀態 使用效率 狀態選擇 資源競爭 識別率 多路 去除 并發 語音 調度 | ||
本發明實施例公開了一種語音識別系統和方法,所述系統包括:引擎資源調度模塊和至少兩個引擎處理模塊;其中,所述引擎資源調度模塊用于根據所述至少兩個引擎處理模塊的狀態選擇目標引擎處理模塊;所述至少兩個引擎處理模塊中的目標引擎處理模塊用于對接收到的語音數據進行語音識別。由于引擎資源調度模塊對引擎處理模塊的調度,可以讓處于空閑狀態的引擎處理模塊進行語音識別,避免了多個語音數據同時由一個引擎處理模塊處理時造成的資源競爭,降低識別效率的問題,實現了在高并發情況下提升語音識別引擎的識別率和使用效率,同時去除引擎處理模塊識別多路語音的復雜設計。
技術領域
本發明涉及互聯網技術領域,尤其涉及一種語音識別系統和方法。
背景技術
語音識別技術,也被稱為自動語音識別(ASR,Automatic Speech Recognition),是要將人類的語音中的詞匯內容轉換為計算機可讀的輸入。目前,語音識別技術成為人工智能領域一項比較通用的技術。
現有技術中的語音識別系統作為一個整體,整合了所有的應用邏輯,不僅要處理語音數據的識別,還要處理多路數據的并發訪問,以及各種引擎參數,模型的動態配置等等,這樣的好處是可以方便部署,結構相對簡單。但是由于系統過于龐大,維護升級不方便。同時,語音識別引擎只能單路識別語音數據,通過多線程支持識別引擎同一時刻處理多路音頻數據是非常復雜,多線程處理多路音頻數據容易出現bug,而且實現起來非常困難,因此,語音處理的可靠性和效率都低。
發明內容
本發明提供一種語音識別系統和方法,可以在高并發情況下提升語音識別引擎的識別率和使用效率。
第一方面,本發明實施例提供了一種語音識別系統,所述系統包括:引擎資源調度模塊和至少兩個引擎處理模塊;
其中,所述引擎資源調度模塊用于根據所述至少兩個引擎處理模塊的狀態選擇目標引擎處理模塊;
所述至少兩個引擎處理模塊中的所述目標引擎處理模塊用于對接收到的語音數據進行語音識別。
可選的,所述系統還包括:前置語音處理模塊,用于接收用戶發送的語音數據并對所述語音數據進行預處理,將預處理后的語音數據發送至所述目標引擎處理模塊。
可選的,所述引擎資源調度模塊還用于:
在選擇目標引擎處理模塊之后,將所述目標引擎處理模塊的地址發送至所述前置語音模塊;
相應的,所述前置語音處理模塊具體用于:根據所述目標引擎處理模塊的地址將預處理后的語音數據發送至所述目標引擎處理模塊。
可選的,所述系統還包括:帳號校驗模塊,用于存儲用戶信息以及與用戶帳號相關的引擎模型參數信息。
可選的,所述引擎資源調度模塊還用于:從所述帳號校驗模塊中獲取與當前用戶賬號相關的目標引擎模型參數信息,并發送至前置語音處理模塊;
相應的,所述前置語音處理模塊還用于根據所述目標引擎處理模塊的地址將所述目標引擎模型參數信息發送至所述目標引擎處理模塊;
相應的,所述目標引擎處理模塊還用于依據所述目標引擎模型參數信息對接收到的語音數據進行語音識別。
可選的,所述帳號校驗模塊,還用于對發送所述語音數據的用戶賬號進行賬號驗證。
可選的,所述系統還包括:系統監控模塊,用于對所述引擎資源調度模塊和至少兩個引擎處理模塊的運行狀態進行監控。
可選的,所述系統還包括:代理服務器模塊,用于將用戶發送的語音數據發送至所述前置語音處理模塊。第二方面,本發明實施例還提供了一種語音識別方法,所述方法包括:
引擎資源調度模塊根據至少兩個引擎處理模塊的狀態選擇目標引擎處理模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智能管家科技有限公司,未經北京智能管家科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810758940.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:語音控制終端
- 下一篇:一種連麥方法、裝置、設備及存儲介質





