[發明專利]一種語音關鍵詞識別方法、裝置、終端及服務器有效
| 申請號: | 201710391388.6 | 申請日: | 2017-05-27 |
| 公開(公告)號: | CN107230475B | 公開(公告)日: | 2022-04-05 |
| 發明(設計)人: | 王珺;黃志恒;于蒙;蒲松柏 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/10 | 分類號: | G10L15/10;G10L15/22;G10L15/26 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 關鍵詞 識別 方法 裝置 終端 服務器 | ||
本發明實施例公開了一種語音關鍵詞識別方法、裝置、終端及服務器,通過從構成第一語音的第一幀序列中確定第一目標幀;從語音關鍵詞包括的關鍵字序列中確定目標關鍵字;在確定目標幀的隱層特征向量與目標關鍵字對應的關鍵字模板匹配成功時(關鍵字模板指示包括目標關鍵字的第二語音中的第二目標幀的隱層特征向量),若逐一針對關鍵字序列中的每個關鍵字對應的關鍵字模板,均已確定出位于第一語音中的幀的隱層特征向量與其匹配成功,確定第一語音中包括語音關鍵詞的方式,有效實現了對第一語音中的語音關鍵詞的識別。進一步的,便于使用語音喚醒技術的電子設備在識別出第一語音中包括語音關鍵詞時,自動激活與所述語音關鍵詞相應的處理模塊。
技術領域
本發明涉及語音識別技術領域,具體涉及一種語音關鍵詞識別方法、裝置、終端及服務器。
背景技術
隨著科技的發展,語音喚醒技術在電子設備中的應用越來越廣泛,其極大程度的方便了用戶對電子設備的操作,允許用戶與電子設備之間無需手動交互,即可通過語音關鍵詞激活電子設備中相應的處理模塊。
例如,蘋果手機采用關鍵詞“siri”作為激活蘋果手機中的語音對話智能助理功能的語音關鍵詞,當蘋果手機檢測到用戶輸入包括關鍵詞“siri”的語音時,自動激活蘋果手機中的語音對話智能助理功能。
有鑒于此,提供一種語音關鍵詞識別方法、裝置、終端及服務器,以實現對語音中的語音關鍵詞的識別,對于語音喚醒技術的發展是至關重要的。
發明內容
有鑒于此,本發明實施例提供一種語音關鍵詞識別方法、裝置、終端及服務器,以實現對語音中的語音關鍵詞的識別。
為實現上述目的,本發明實施例提供如下技術方案:
一種語音關鍵詞識別方法,包括:
從構成第一語音的第一幀序列中選取一個幀確定為第一目標幀;
從語音關鍵詞包括的關鍵字序列中選取一個關鍵字確定為目標關鍵字;
確定所述第一目標幀的隱層特征向量是否與所述目標關鍵字對應的關鍵字模板匹配成功,所述關鍵字模板指示包括所述目標關鍵字的第二語音中的第二目標幀的隱層特征向量;
在匹配成功的情況下,若逐一針對關鍵字序列中的每個關鍵字對應的關鍵字模板,均已確定出位于所述第一語音中的幀的隱層特征向量與其匹配成功,確定所述第一語音中包括所述語音關鍵詞。
一種語音關鍵詞識別裝置,包括:
第一目標幀確定單元,用于從構成第一語音的第一幀序列中選取一個幀確定為第一目標幀;
目標關鍵字確定單元,用于從語音關鍵詞包括的關鍵字序列中選取一個關鍵字確定為目標關鍵字;
匹配單元,用于確定所述第一目標幀的隱層特征向量是否與所述目標關鍵字對應的關鍵字模板匹配成功,所述關鍵字模板指示包括所述目標關鍵字的第二語音中的第二目標幀的隱層特征向量;
識別單元,用于在匹配成功的情況下,若逐一針對關鍵字序列中的每個關鍵字對應的關鍵字模板,均已確定出位于所述第一語音中的幀的隱層特征向量與其匹配成功,確定所述第一語音中包括所述語音關鍵詞。
一種終端,包括存儲器和處理器,所述存儲器用于存儲程序,所述處理器調用所述程序,所述程序用于:
從構成第一語音的第一幀序列中選取一個幀確定為第一目標幀;
從語音關鍵詞包括的關鍵字序列中選取一個關鍵字確定為目標關鍵字;
確定所述第一目標幀的隱層特征向量是否與所述目標關鍵字對應的關鍵字模板匹配成功,所述關鍵字模板指示包括所述目標關鍵字的第二語音中的第二目標幀的隱層特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710391388.6/2.html,轉載請聲明來源鉆瓜專利網。





