[發明專利]一種應用于檢測設備的語音控制系統及方法在審
| 申請號: | 202210303027.2 | 申請日: | 2022-03-24 |
| 公開(公告)號: | CN114596857A | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 林永強;林林;汪冰;郭東曉;崔偉亮;周廣濤;譚樂俊 | 申請(專利權)人: | 山東省食品藥品檢驗研究院 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/14;G10L15/06;G10L21/02 |
| 代理公司: | 北京元本知識產權代理事務所(普通合伙) 11308 | 代理人: | 徐蘋 |
| 地址: | 250101 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 檢測 設備 語音 控制系統 方法 | ||
1.一種應用于檢測設備的語音控制方法,其特征在于,包括:
客戶端設備中的顯示器顯示一條或多條語音輸入提示,其中所述一條或多條語音輸入提示中的每一條語音輸入提示對應一個或多個語音控制指令;
拾音設備中的拾音器陣列拾取音頻信號,所述拾音器陣列包括多支拾音器;拾音設備中的波束成形器通過對拾音器陣列拾取的音頻信號中的子信號進行語音增強處理而從中提取用戶的語音信號;
語音設備中的關鍵詞識別器識別預設的關鍵詞;語音設備中的語音識別器用于對語音信號進行語音識別處理,并根據語音信號中被識別的語音內容創建語音控制指令;
所述語音識別器通過與其相連接的客戶端設備與檢測設備進行通信,所述客戶端設備接收語音識別器的語音控制指令進行解析后配置相應的檢測設備進行對應的檢測操作,檢測結果反饋至所述客戶端設備并通過其顯示器進行顯示,同時將檢測結果發送到語音設備中的語音合成器,所述語音合成器對檢測結果進行語音合成并通過客戶端設備中的揚聲器進行播報;
控制設備接收與其相連接的所述關鍵詞識別器發送的關鍵詞識別結果;所述控制設備基于該關鍵詞識別結果對與其相連接的波束成形器進行波束成形控制,以便于對拾音器陣列拾取的音頻信號中的第n個子信號進行語音增強處理,所述第n個子信號為來自處于相對于拾音器陣列的第n個方位角度的用戶所發出的語音信號,其中n為大于0的整數。
2.根據權利要求1所述的語音控制方法,其特征在于,
其中,所述語音識別器對語音信號進行語音識別處理,具體包括:所述語音識別器對其接收到的語音信號進行濾波從而去除其中的冗余信息,利用Mel頻率倒譜系數方法進行特征提取,提取得到的特征參數與聲學模型進行匹配獲得初步識別結果,然后通過語音解碼和搜索算法結合字典解析得到最終的語音識別結果。
3.根據權利要求2所述的語音控制方法,其特征在于,
其中,所述聲學模型的建模采用隱馬爾可夫模型,對預先識別的檢測指令相關語音數據進行訓練,將訓練好的聲學模型移植到語音識別器對中;其中,語音識別器的語言模型采用N-Gram模型,通過對檢測術語文本信息進行訓練獲得關鍵詞關聯概率。
4.根據權利要求1所述的語音控制方法,其特征在于,
其中,所述控制設備基于該關鍵詞識別結果對與其相連接的波束成形器進行波束成形控制,具體包括:所述控制設備在啟動時基于第m位用戶在第n個方位角度處發出的語音信號而進行校準,所述控制設備控制并調諧波束成形器的波束方向至從與該方位角度匹配的方向,利用拾音器陣列拾取該方位角度所發出的音頻信號,其中m為大于0的整數;所述語音設備接收與其相連接的拾音設備所拾取的音頻信號并過濾來自與該方位角度不同方向且超出設定閾值的音頻信號;
當第m位用戶移動到其他方位角度并發出包含預設關鍵字的語音信號時,通過關鍵詞識別器識別用戶發出的語音中的關鍵字并由所述控制系統重新進行校準,控制系統控制并調諧波束成形器的波束方向至第m位用戶當前移動到的方向角度。
5.根據權利要求2-4任一項所述的語音控制方法,其特征在于,
其中,所述關鍵詞包括所述喚醒詞,所述喚醒詞由用戶預先設置;
在語音設備開始使用語音識別器進行語音識別處理前,所述語音設備首先利用關鍵詞識別器進行喚醒詞的識別;當所述關鍵詞識別器識別到用戶發出的語音中包含的喚醒詞后,所述語音設備響應于喚醒詞并激活所述語音識別器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省食品藥品檢驗研究院,未經山東省食品藥品檢驗研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210303027.2/1.html,轉載請聲明來源鉆瓜專利網。





