[發明專利]一種關鍵詞識別方法、裝置、設備及可讀存儲介質有效
| 申請號: | 202010074563.0 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111276124B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 徐超;宮云梅;浦宏杰;鄢仁祥 | 申請(專利權)人: | 蘇州科達科技股份有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/16;G10L15/18;G10L15/26;G10L25/03 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 田媛媛 |
| 地址: | 215011 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關鍵詞 識別 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種關鍵詞識別方法,其特征在于,包括:
對連續語音信號中的幀信號進行語音激活檢測,獲得并緩存每一幀信號對應的語音激活標志;
對緩存的各個所述語音激活標志進行統計,并利用統計結果確定緩存的各個所述語音激活標志對應的目標語音信號是否存在語音段;
如果是,則對所述連續語音信號中的幀信號進行特征提取,獲得每一幀信號對應的聲音特征并將所述聲音特征存入特征矩陣中;對所述目標語音信號對應的特征矩陣進行關鍵詞識別后,將緩存的所述語音激活標志清零;其中,所述特征矩陣包括每一幀信號對應的梅爾頻率倒數系數;
如果否,則繼續對所述連續語音信號中的未檢測幀信號進行語音激活檢測;
其中,所述對緩存的各個所述語音激活標志進行統計,并利用統計結果確定緩存的各個所述語音激活標志對應的目標語音信號是否存在語音段,包括:
統計緩存的各個所述語音激活標志中連續有語音激活標志的比例或個數;
判斷所述比例是否大于語音比例,或判斷所述個數是否大于語音個數;
如果是,則確定所述目標語音信號有語音段;
如果否,則確定所述目標語音信號無語音段;
其中,對所述目標語音信號對應的特征矩陣進行關鍵詞識別,包括:
利用關鍵詞識別模型對所述特征矩陣進行推理,獲得分類標簽得分數組;
從所述分類標簽得分數組中篩選出目標關鍵詞索引;
在所述目標關鍵詞索引的得分大于分數閾值時,輸出所述目標關鍵詞索引對應的目標關鍵詞;
在所述目標關鍵詞索引的得分小于等于分數閾值時,輸出無檢測結果的提示信息。
2.根據權利要求1所述的關鍵詞識別方法,其特征在于,所述對連續語音信號中的幀信號進行語音激活檢測,獲得并緩存每一幀信號對應的語音激活標志的步驟,包括:
從緩存讀取所述連續語音信號對應的每一幀信號,并對每一幀信號進行語音激活檢測,獲得每一幀信號對應的所述語音激活標志;
按照先入先出方式對緩存的所述語音激活標志進行更新。
3.根據權利要求1所述的關鍵詞識別方法,其特征在于,對所述連續語音信號中的幀信號進行特征提取,獲得每一幀信號對應的聲音特征并將所述聲音特征存入特征矩陣中,包括:
對所述連續語音信號中的幀信號進行梅爾頻率倒數系數提取,獲得每一幀信號對應的梅爾頻率倒數系數并存入特征矩陣中。
4.根據權利要求2所述的關鍵詞識別方法,其特征在于,在輸出所述目標關鍵詞索引對應的目標關鍵詞之后,還包括:
判斷所述連續語音信號的幀信號是否已完成語音激活檢測;
如果否,則執行所述繼續對所述連續語音信號中的未檢測幀信號進行語音激活檢測的步驟;
如果是,則輸出關鍵詞識別已完成的提示信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州科達科技股份有限公司,未經蘇州科達科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074563.0/1.html,轉載請聲明來源鉆瓜專利網。





