[發明專利]關鍵詞樣本確定方法、語音識別方法、裝置、設備和介質有效
| 申請號: | 201910189413.1 | 申請日: | 2019-03-13 |
| 公開(公告)號: | CN109979440B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 李敬 | 申請(專利權)人: | 廣州市網星信息技術有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/04;G10L15/22 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 510000 廣東省廣州市南沙區豐澤東路106*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵詞 樣本 確定 方法 語音 識別 裝置 設備 介質 | ||
本發明公開了一種關鍵詞樣本確定方法、語音識別方法、裝置、設備和介質。其中,該關鍵詞樣本確定方法包括:獲取關鍵詞;在已有的語音識別樣本庫中獲取包括所述關鍵詞的目標語音樣本;確定所述目標語音樣本中的關鍵詞語音片段,得到關鍵詞樣本。本發明實施例提供的技術方案,無需通過專門錄制在各個場景下各用戶的關鍵詞語音來生成關鍵詞樣本,通過在已有的語音識別樣本庫中獲取包含關鍵詞的目標語音樣本,并截取出目標語音樣本中的關鍵詞語音片段,得到關鍵詞樣本,減少了關鍵詞樣本的獲取成本,提高了關鍵詞樣本確定的全面性,通過該關鍵詞樣本訓練得到的關鍵詞識別模型來識別相應用戶語音中包含的關鍵詞,提高了語音識別的準確性。
技術領域
本發明實施例涉及語音識別技術領域,尤其涉及一種關鍵詞樣本確定方法、語音識別方法、裝置、設備和介質。
背景技術
隨著市場上的智能音箱不斷增多,語音識別領域的相關技術得到了很大的發展和應用,其中關鍵詞識別(Key Word Spotting,KWS)技術作為語音交互控制的基礎也得到了廣泛的應用。
目前,KWS技術中主要采用基于各類神經網絡的方式來識別語音中攜帶的關鍵詞,此時需要采集大量包含預先定義的關鍵詞和非關鍵詞的音頻數據,由該音頻數據對構建的神經網絡中的參數進行訓練、驗證和測試,使得構建的神經網絡能夠準確識別用戶語音中的關鍵詞信息。
現有方案中通過人工錄制對應的關鍵詞語音,以采集大量的音頻數據來得到關鍵詞訓練集,需要花費較高的成本,而且要求所采集音頻數據的錄音環境與預先定義的關鍵詞所在的實際環境一致,從而導致各類關鍵詞的生成存在一定的局限性。
發明內容
本發明實施例提供了一種關鍵詞樣本確定方法、語音識別方法、裝置、設備和介質,提高關鍵詞樣本確定的全面性,增強語音識別的準確性。
第一方面,本發明實施例提供了一種關鍵詞樣本確定方法,該方法包括:
獲取關鍵詞;
在已有的語音識別樣本庫中獲取包括所述關鍵詞的目標語音樣本;
確定所述目標語音樣本中的關鍵詞語音片段,得到關鍵詞樣本。
第二方面,本發明實施例提供了一種語音識別方法,該方法包括:
獲取用戶的語音指令;
通過關鍵詞識別模型識別所述語音指令中的關鍵詞,所述關鍵詞識別模型預先通過如第一方面中所述的關鍵詞樣本確定方法確定的關鍵詞樣本訓練;
根據所述關鍵詞觸發相應的操作。
第三方面,本發明實施例提供了一種關鍵詞樣本確定裝置,該裝置包括:
關鍵詞獲取模塊,用于獲取關鍵詞;
目標語音獲取模塊,用于在已有的語音識別樣本庫中獲取包括所述關鍵詞的目標語音樣本;
關鍵詞樣本確定模塊,用于確定所述目標語音樣本中的關鍵詞語音片段,得到關鍵詞樣本。
第四方面,本發明實施例提供了一種語音識別裝置,該裝置包括:
語音指令獲取模塊,用于獲取用戶的語音指令;
關鍵詞識別模塊,用于通過關鍵詞識別模型識別所述語音指令中的關鍵詞,所述關鍵詞識別模型預先通過如第三方面中所述的關鍵詞樣本確定裝置確定的關鍵詞樣本訓練;
操作觸發模塊,用于根據所述關鍵詞觸發相應的操作。
第五方面,本發明實施例提供了一種設備,該設備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州市網星信息技術有限公司,未經廣州市網星信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910189413.1/2.html,轉載請聲明來源鉆瓜專利網。





