[發明專利]一種語音激活檢測方法及裝置有效
| 申請號: | 201610886934.9 | 申請日: | 2016-10-11 |
| 公開(公告)號: | CN107919116B | 公開(公告)日: | 2019-09-13 |
| 發明(設計)人: | 范利春;朱磊 | 申請(專利權)人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14;G10L15/16;G10L25/51 |
| 代理公司: | 北京中原華和知識產權代理有限責任公司 11019 | 代理人: | 壽寧 |
| 地址: | 310000 浙江省杭州市余杭區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 激活 檢測 方法 裝置 | ||
1.一種語音激活檢測方法,其特征在于,應用于對設置有激活詞的語音識別設備進行激活時的語音檢測,包括以下步驟:
步驟S1,對待測語音數據進行端點檢測,以獲取包含語音信號的語音數據;
步驟S2,利用預先訓練形成的語音識別聲學模型處理得到關聯于所述包含語音信號的語音數據的三音子后驗概率;
步驟S3,對所述三音子后驗概率進行流式動態規劃,以處理得到所述包含語音信號的語音數據在所述激活詞上的路徑得分;
步驟S4,將所述路徑得分與預先設定的第一閾值進行比較:
若所述路徑得分小于所述第一閾值,則判斷所述包含語音信號的語音數據為非激活語音,隨后退出;
步驟S5,進行回溯,找到所述包含語音信號的語音數據的起始位置,并根據所述起始位置獲取語音片段;
步驟S6,利用預先訓練形成的雙向循環神經網絡對所述語音片段進行前向處理,并根據處理結果判斷是否激活所述語音識別設備。
2.如權利要求1所述的語音激活檢測方法,其特征在于,所述步驟S6中,根據處理結果判斷是否激活所述語音識別設備的判斷步驟具體包括:將所述處理結果與預先設定的第二閾值進行比較,并在所述處理結果大于所述第二閾值時激活所述設備。
3.如權利要求1所述的語音激活檢測方法,其特征在于,所述端點檢測為基于短時能量、音高或神經網絡的端點檢測。
4.如權利要求1所述的語音激活檢測方法,其特征在于,所述語音識別聲學模型為基于GMM-HMM的聲學模型或基于DNN-HMM框架的聲學模型。
5.如權利要求1所述的語音激活檢測方法,其特征在于,關聯于所述包含語音信號的語音數據的三音子后驗概率為一聲學得分矩陣,所述聲學得分矩陣包括所述包含語音信號的語音數據的每一幀語音在所述激活詞所包含的三音子上的得分。
6.如權利要求1所述的語音激活檢測方法,其特征在于,所述語音片段為只包括所述激活詞的語音片段。
7.如權利要求1所述的語音激活檢測方法,其特征在于,所述雙向循環神經網絡為BLSTM循環神經網絡。
8.如權利要求1所述的語音激活檢測方法,其特征在于,所述步驟S6中,預先訓練形成所述雙向循環神經網絡的訓練步驟包括:
步驟S61,對包含激活詞的語音進行處理以獲取只包含激活詞的語音片段;
步驟S62,利用所述只包含激活詞的語音片段對所述雙向循環神經網絡進行訓練。
9.一種語音激活檢測裝置,其特征在于,應用于設置有激活詞的語音識別設備上,以在對所述語音識別設備進行激活時進行語音檢測,包括:
端點檢測模塊,對待測語音數據進行端點檢測,以獲取包含語音信號的語音數據;
聲學打分模塊,與所述端點檢測模塊連接,以利用預先訓練形成的語音識別聲學模型處理得到關聯于所述包含語音信號的語音數據的三音子后驗概率;
動態規劃模塊,與所述聲學打分模塊連接,對所述三音子后驗概率進行流式動態規劃,以處理得到所述包含語音信號的語音數據在所述激活詞上的路徑得分;
比較模塊,與所述動態規劃模塊連接,且所述比較模塊中預先設定有第一閾值,所述比較模塊將所述路徑得分與預先設定的第一閾值進行比較,并根據比較結果判斷所述包含語音信號的語音數據是否為激活語音;
回溯模塊,與所述比較模塊連接,以在所述比較結果判斷所述包含語音信號的語音數據為激活語音時進行回溯,找到所述包含語音信號的語音數據的起始位置,并根據所述起始位置獲取語音片段;
處理比較模塊,與所述回溯模塊連接,并包括預先訓練形成的雙向循環神經網絡,以利用預先訓練形成的雙向循環神經網絡對所述語音片段進行前向處理,并根據處理結果判斷是否激活所述語音識別設備。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于芋頭科技(杭州)有限公司,未經芋頭科技(杭州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610886934.9/1.html,轉載請聲明來源鉆瓜專利網。





