[發明專利]語音關鍵詞檢測模型處理方法、裝置及計算機設備在審
| 申請號: | 202110758671.4 | 申請日: | 2021-07-05 |
| 公開(公告)號: | CN113421554A | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 李澤遠;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L13/08;G10L13/02 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 關鍵詞 檢測 模型 處理 方法 裝置 計算機 設備 | ||
本申請實施例屬于人工智能領域,涉及一種語音關鍵詞檢測模型處理方法、裝置、計算機設備及存儲介質,方法包括:獲取包含關鍵詞的初始文本、預先存儲的語音聲紋表征以及包含關鍵詞的真實語音;根據所述語音聲紋表征和所述初始文本,合成與所述初始文本相對應的合成語音;將所述真實語音和所述合成語音設置為初始待混合語音,并對所述初始待混合語音進行聲學特征調整,得到待混合語音;對所述待混合語音進行混合增強,得到訓練語音;根據所述訓練語音對初始語音關鍵詞建模型進行訓練,得到語音關鍵詞檢測模型。此外,本申請還涉及區塊鏈技術,語音聲紋表征可存儲于區塊鏈中。本申請提高了語音關鍵詞檢測模型的訓練效率。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種語音關鍵詞檢測模型處理方法、裝置、計算機設備及存儲介質。
背景技術
語音關鍵詞檢測是語音識別的一個分支領域,主要用于識別語音信號中是否出現特定詞匯以及特定詞匯出現的位置。語音關鍵詞檢測的應用場景包括喚醒系統、命令詞控制系統以及語音敏感詞檢測等。
語音關鍵詞檢測可以通過語音關鍵詞檢測模型實現,在此之前需要先通過機器學習得到可用的語音關鍵詞檢測模型。機器學習對訓練數據具有較高的依賴性,大量且豐富的訓練數據可以保證語音關鍵詞檢測模型的準確性。因此,在訓練之前需要準備大量包含關鍵詞的語音數據,當出現新的關鍵詞檢測需求時,還需要隨時更新語音數據,這些都需要花費大量的時間和人力成本,導致模型訓練的成本較高,語音關鍵詞檢測模型訓練效率較低。
發明內容
本申請實施例的目的在于提出一種語音關鍵詞建模型處理方法、裝置、計算機設備及存儲介質,以解決語音關鍵詞檢測模型訓練效率較低的問題。
為了解決上述技術問題,本申請實施例提供一種語音關鍵詞檢測模型處理方法,采用了如下所述的技術方案:
獲取包含關鍵詞的初始文本、預先存儲的語音聲紋表征以及包含關鍵詞的真實語音;
根據所述語音聲紋表征和所述初始文本,合成與所述初始文本相對應的合成語音;
將所述真實語音和所述合成語音設置為初始待混合語音,并對所述初始待混合語音進行聲學特征調整,得到待混合語音;
對所述待混合語音進行混合增強,得到訓練語音;
根據所述訓練語音對初始語音關鍵詞建模型進行訓練,得到語音關鍵詞檢測模型。
為了解決上述技術問題,本申請實施例還提供一種語音關鍵詞檢測模型處理裝置,采用了如下所述的技術方案:
獲取模塊,用于獲取包含關鍵詞的初始文本、預先存儲的語音聲紋表征以及包含關鍵詞的真實語音;
語音合成模塊,用于根據所述語音聲紋表征和所述初始文本,合成與所述初始文本相對應的合成語音;
聲學調整模塊,用于將所述真實語音和所述合成語音設置為初始待混合語音,并對所述初始待混合語音進行聲學特征調整,得到待混合語音;
混合增強模塊,用于對所述待混合語音進行混合增強,得到訓練語音;
模型訓練模塊,用于根據所述訓練語音對初始語音關鍵詞建模型進行訓練,得到語音關鍵詞檢測模型。
為了解決上述技術問題,本申請實施例還提供一種計算機設備,采用了如下所述的技術方案:
獲取包含關鍵詞的初始文本、預先存儲的語音聲紋表征以及包含關鍵詞的真實語音;
根據所述語音聲紋表征和所述初始文本,合成與所述初始文本相對應的合成語音;
將所述真實語音和所述合成語音設置為初始待混合語音,并對所述初始待混合語音進行聲學特征調整,得到待混合語音;
對所述待混合語音進行混合增強,得到訓練語音;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110758671.4/2.html,轉載請聲明來源鉆瓜專利網。





