[發明專利]喚醒詞識別的方法、裝置及存儲介質有效
| 申請號: | 202010305090.0 | 申請日: | 2020-04-17 |
| 公開(公告)號: | CN111653274B | 公開(公告)日: | 2023-08-04 |
| 發明(設計)人: | 靳源;馮大航;陳孝良 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/06 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 邢少真 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 喚醒 識別 方法 裝置 存儲 介質 | ||
本公開揭示了一種喚醒詞識別的方法、裝置及存儲介質,屬于機器學習技術領域。所述方法包括:首先識別設備獲取目標語音數據,然后,識別設備通過喚醒詞識別模型對該目標語音數據進行處理,獲得處理結果,其中,喚醒詞識別模型是通過樣本數據和該樣本數據對應的標簽訓練獲得的機器學習模型,最后根據該處理結果,確定該目標語音數據的識別結果。通過上述方案,識別設備可以通過利用軟標簽訓練更新的喚醒詞識別模型對目標語音數據進行喚醒詞識別,喚醒詞樣本數據的各個語音特征可以對應各個軟標簽,從而解決了強制對齊后邊界不清晰的問題,保證了喚醒詞識別模型訓練效果,提高了喚醒詞識別的準確度。
技術領域
本公開涉及機器學習技術領域,特別是涉及一種喚醒詞識別的方法、裝置及存儲介質。
背景技術
在人工智能場景下,越來越多的產品設備可以通過語音交互實現產品的功能,語音交互的起始可以是接收到產品設備相應的喚醒詞,當產品設備接收到相應的喚醒詞時,該產品設備可以與用戶進行正常的語音交互從而實現相應的功能。
在相關技術中,產品設備識別喚醒詞的功能可以通過一個訓練好的機器學習模型來實現,訓練機器學習模型的過程可以運用深度神經網絡和隱馬爾可夫模型相結合的方式建立喚醒模型,對輸入的喚醒詞數據進行強制對齊得到相應的標簽,通過將強制對齊處理的喚醒詞數據輸入到喚醒模型中,對喚醒模型進行訓練。
然而,相關技術中的方案,對喚醒詞數據進行強制對齊生成硬標簽,輸入到喚醒詞識別模型中,從而進一步訓練喚醒詞識別模型,這種方案會導致需要建立一個復雜的ASR(Automatic?Speech?Recognition,自動語音識別技術)模型進行強制對齊生成相應的硬標簽,由于通過硬標簽訓練喚醒詞識別模型對硬標簽的對齊準確性要求很高,會發生由于強制對齊生成硬標簽的準確性不夠以及邊界不清晰的情況影響模型訓練的效果,從而導致喚醒詞識別模型的準確率不高。
發明內容
本公開提供一種喚醒詞識別的方法、裝置及存儲介質。所述技術方案如下:
根據本公開實施例的第一方面,提供了一種喚醒詞識別的方法,其特征在于,所述方法包括:
獲取目標語音數據,所述目標語音數據用來指示需要進行喚醒詞識別的語音數據;
通過喚醒詞識別模型對所述目標語音數據進行處理,獲得處理結果;所述喚醒詞識別模型是通過樣本數據和所述樣本數據對應的標簽訓練獲得的機器學習模型;所述樣本數據至少包括喚醒詞樣本數據和非喚醒詞樣本數據;所述樣本數據對應的標簽包括所述喚醒詞樣本數據對應的軟標簽以及所述非喚醒詞樣本數據對應的硬標簽;所述喚醒詞樣本數據對應的軟標簽是通過計算確定的概率分布;所述處理結果是所述樣本數據通過更新后的所述喚醒詞識別模型獲得的所述識別情況的概率值;
根據所述處理結果,確定所述目標語音數據的識別結果。
在一種可能的實現方式中,所述方法還包括:
通過喚醒詞識別模型對所述目標語音數據進行處理,獲得處理結果之前,通過對所述喚醒詞樣本數據進行處理,獲得所述喚醒詞樣本數據對應的軟標簽;
將所述非喚醒詞樣本數據的所述標簽確定為固定概率的硬標簽,所述固定概率用來指示所述非喚醒詞樣本數據為喚醒詞的概率為0,所述非喚醒詞樣本數據為非喚醒詞的概率為1;
根據所述喚醒詞樣本數據、所述喚醒詞樣本數據對應的軟標簽以及所述非喚醒詞樣本數據對應的硬標簽,對所述喚醒詞識別模型進行更新。
在一種可能的實現方式中,所述根據所述喚醒詞樣本數據以及所述喚醒詞樣本數據對應的軟標簽,對所述喚醒詞識別模型進行更新,包括:
將所述喚醒詞樣本數據通過所述喚醒詞識別模型,確定所述喚醒詞樣本數據識別情況對應的概率值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010305090.0/2.html,轉載請聲明來源鉆瓜專利網。





