[發明專利]一種語音激活檢測方法及裝置有效
| 申請號: | 201610886934.9 | 申請日: | 2016-10-11 |
| 公開(公告)號: | CN107919116B | 公開(公告)日: | 2019-09-13 |
| 發明(設計)人: | 范利春;朱磊 | 申請(專利權)人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14;G10L15/16;G10L25/51 |
| 代理公司: | 北京中原華和知識產權代理有限責任公司 11019 | 代理人: | 壽寧 |
| 地址: | 310000 浙江省杭州市余杭區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 激活 檢測 方法 裝置 | ||
本發明涉及語音識別技術領域,尤其涉及一種語音激活檢測方法及裝置,通過采用兩次激活檢測的方法,將第一次激活判斷中取到的語音片段輸入BLSTM循環神經網絡,通過對整條語音的所有幀進行處理,最終判定是否激活語音識別設備。在兩次激活確認中,第一次激活的閾值可以設置適當寬松,以保證較高的檢出率;第二次激活確認由于已知起始點,相對更加準確,兩次激活檢測能夠同時降低誤激活和漏激活,即有效降低激活的等錯誤率,從而更加有效的保證激活的性能。
技術領域
本發明涉及語音識別領域,尤其涉及一種利用雙向循環神經網絡進行二次確認的語音激活檢測方法及裝置。
背景技術
很多語音識別設備需要語音激活之后才能夠拾音進而進行識別。語音識別設備激活之后才進行拾音一來是為了降低設備功耗,二來是為了減少不需要進行識別的語音進入語音識別流程,進而帶來不必要的響應。近場語音識別環境中,比如手機端的語音識別,可以采用觸摸或按鍵等方式進入拾音狀態。在遠場識別中,或是近場識別但不方便用手操作的時候,利用語音對設備進行激活使設備進入拾音狀態就變得不可或缺。語音激活通常是先設定激活詞,然后對設備說出激活詞,設備被喚醒之后進入拾音狀態。
語音激活最簡單直觀的方法是利用語音識別的方法,把激活的語音送入語音識別器進行識別,如果識別結果是激活詞或者包含激活詞,那么設備激活。實際上,只需要對激活語音進行聲學打分,計算在設定激活詞上的聲學得分即可,同時還可以根據得分設定接受和拒絕的閾值;然而閾值是非常難于控制的,這是因為閾值設定太低會帶來很多的誤激活,閾值設定太高則使得語音識別設備難以被激活。這種現象對于較短的激活詞尤其嚴重。
如何找到一種同時降低誤激活和降低漏激活(即降低激活的等錯誤率)的方法成為本領域技術人員致力于研究的方向。
發明內容
針對上述存在的問題,本發明公開一種語音激活檢測方法,其中,應用于對設置有激活詞的語音識別設備進行激活時的語音檢測,包括以下步驟:
步驟S1,對待測語音數據進行端點檢測,以獲取包含語音信號的語音數據;
步驟S2,利用預先訓練形成的語音識別聲學模型處理得到關聯于所述包含語音信號的語音數據的三音子后驗概率;
步驟S3,對所述三音子后驗概率進行流式動態規劃,以處理得到所述包含語音信號的語音數據在所述激活詞上的路徑得分;
步驟S4,將所述路徑得分與預先設定的第一閾值進行比較:
若所述路徑得分小于所述第一閾值,則判斷所述包含語音信號的語音數據為非激活語音,隨后退出;
步驟S5,進行回溯,找到所述包含語音信號的語音數據的起始位置,并根據所述起始位置獲取語音片段;
步驟S6,利用預先訓練形成的雙向循環神經網絡對所述語音片段進行前向處理,并根據處理結果判斷是否激活所述語音識別設備。
上述的語音激活檢測方法,其中,所述步驟S6中,根據處理結果判斷是否激活所述語音識別設備的判斷步驟具體包括:將所述處理結果與預先設定的第二閾值進行比較,并在所述處理結果大于所述第二閾值時激活所述設備。
上述的語音激活檢測方法,其中,所述端點檢測為基于短時能量、音高或神經網絡的端點檢測。
上述的語音激活檢測方法,其中,所述語音識別聲學模型為基于GMM-HMM的聲學模型或基于DNN-HMM框架的聲學模型。
上述的語音激活檢測方法,其中,關聯于所述包含語音信號的語音數據的三音子后驗概率為一聲學得分矩陣,所述聲學得分矩陣包括所述包含語音信號的語音數據的每一幀語音在所述激活詞所包含的三音子上的得分。
上述的語音激活檢測方法,其中,所述語音片段為只包括所述激活詞的語音片段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于芋頭科技(杭州)有限公司,未經芋頭科技(杭州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610886934.9/2.html,轉載請聲明來源鉆瓜專利網。





