[發明專利]一種語音關鍵詞識別方法、裝置、終端及服務器有效
| 申請號: | 201910759284.5 | 申請日: | 2017-05-27 |
| 公開(公告)號: | CN110444199B | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 王珺;黃志恒;于蒙;蒲松柏 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/10 | 分類號: | G10L15/10;G10L15/22;G10L15/26 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 駱蘇華 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 關鍵詞 識別 方法 裝置 終端 服務器 | ||
1.一種語音關鍵詞識別方法,其特征在于,包括:
確定第一目標幀的隱層特征向量是否與語音關鍵詞包括的關鍵字序列中的目標關鍵字對應的關鍵字模板匹配成功,所述關鍵字模板指示包括所述目標關鍵字的第二語音中的第二目標幀的隱層特征向量;所述第一目標幀為第一幀序列中的從未被作為第一目標幀的、且在第一幀序列中排序最靠前的幀,所述第一幀序列用于構成第一語音;
若匹配成功,判斷所述目標關鍵字是否為所述關鍵字序列中的最后一個關鍵字;如果所述目標關鍵字為所述關鍵字序列中的最后一個關鍵字,確定所述第一語音中包括所述語音關鍵詞;如果所述目標關鍵字不為所述關鍵字序列中的最后一個關鍵字,將所述關鍵字序列中的與所述目標關鍵字相鄰的下一關鍵字確定為新的目標關鍵字,將所述第一幀序列中與所述第一目標幀相鄰的下一幀確定為新的第一目標幀,返回執行“確定第一目標幀的隱層特征向量是否與目標關鍵字對應的關鍵字模板匹配成功”步驟;
若匹配失敗,判斷所述目標關鍵字被連續被匹配的次數是否達到預設的閾值;若未達到,返回執行“確定第一目標幀的隱層特征向量是否與目標關鍵字對應的關鍵字模板匹配成功”步驟;若達到,將所述關鍵字序列中的第一個關鍵字確定為新的目標關鍵字,返回執行“確定第一目標幀的隱層特征向量是否與目標關鍵字對應的關鍵字模板匹配成功”步驟。
2.根據權利要求1所述的方法,其特征在于,所述關鍵字模板的生成過程包括:
確定包括所述目標關鍵字的第二語音,所述第二語音由第二幀序列構成;
將所述第二語音作為預設的語音模型的輸入信息,確定分別與所述第二幀序列中的每個幀對應的終層特征向量;
基于分別與每個幀對應的終層特征向量,從所述第二幀序列中確定第二目標幀;
根據將所述第二目標幀作為所述語音模型的輸入信息所得到的與所述第二目標幀對應的隱層特征向量,生成與所述目標關鍵字對應的關鍵字模板。
3.根據權利要求2所述的方法,其特征在于,所述幀對應的終層特征向量,包括:所述幀分別與所述語音模型中預設的文字集中的每個文字之間的相似度,所述目標關鍵字為所述文字集中的一個文字;
所述基于分別與每個幀對應的終層特征向量,從所述第二幀序列中確定第二目標幀,包括:
基于分別與每個幀對應的終層特征向量,從所述第二幀序列中選取與所述目標關鍵字的相似程度最高的幀作為第二目標幀;其中,幀與所述目標關鍵字的相似程度根據所述幀分別與所述文字集中的每個文字之間的相似度確定。
4.根據權利要求3所述的方法,其特征在于,所述基于分別與每個幀對應的終層特征向量,從所述第二幀序列中選取與所述目標關鍵字的相似程度最高的幀作為第二目標幀,包括:
從所述第二幀序列中確定至少一個第一候選幀,所述第一候選幀與所述目標關鍵字的相似度小于所述第一候選幀與所述文字集中的至少一個文字的相似度,所述至少一個文字的個數小于預設數值;
從所述至少一個第一候選幀中確定至少一個第二候選幀,所述至少一個第二候選幀為所述至少一個第一候選幀中與所述目標關鍵字的相似度最大的各第一候選幀;
從所述至少一個第二候選幀中確定第二目標幀,按照相似度從高到低的順序,所述第二目標幀與所述目標關鍵字的相似度位于所述第二目標幀與各文字的相似度中的排名,高于除所述第二目標幀外的每個所述第二候選幀與所述目標關鍵字的相似度位于所述第二候選幀與各文字的相似度中的排名。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910759284.5/1.html,轉載請聲明來源鉆瓜專利網。





