[發明專利]用于語音識別的模板訓練方法、語音識別方法及其系統在審
| 申請號: | 201811019915.1 | 申請日: | 2018-09-03 |
| 公開(公告)號: | CN110875034A | 公開(公告)日: | 2020-03-10 |
| 發明(設計)人: | 吳威;張楠賡 | 申請(專利權)人: | 北京嘉楠捷思信息技術有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06 |
| 代理公司: | 北京市中倫律師事務所 11410 | 代理人: | 楊黎峰;鐘錦舜 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 語音 識別 模板 訓練 方法 及其 系統 | ||
本發明的實施方式提供了一種用于語音識別的模板訓練方法、語音識別方法及其系統,訓練方法包括:針對預設命令詞,采集多個語音樣本以構建訓練樣本集;通過基于訓練樣本集的迭代訓練獲取語音識別模板;根據迭代訓練中獲取的相似度為語音識別模板設置匹配閾值。本發明通過采用在訓練模板中為語音識別模板設置匹配閾值,以及在語音識別時對具有最佳匹配度的語音識別模板進行閾值驗證的技術方案,保證了識別的正確率,并因此顯著降低了誤識別率。
技術領域
本發明涉及語音識別領域,具體涉及一種用于語音識別的模板訓練方法、語音識別方法及其系統。
背景技術
本部分旨在為權利要求書中陳述的本發明的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
在整個語音識別過程中,一個重要的問題就是如何選取語音識別模板。語音識別的過程是將待識別的語音特征,依次與每個預先訓練好的語音識別模板進行匹配,找出匹配最佳的那個語音識別模板作為識別結果。但是,若所說的命令實際上并不包含在所有模板當中,語音識別系統仍然能夠找到一個相對匹配最佳的模板作為匹配模板輸出,并因此造成誤識別。
針對上述誤識別問題,現有技術中主要采用以下方法:預先訓練獲得多個垃圾詞條的模板并參與到語音識別過程。例如,對于應用于人機交互應用場景中的識別系統而言,語音識別系統往往會接收到用戶口頭禪,例如“哎呦”等無實際意義的語音信號,那么可以將上述無實際意義的語音信號作為模板參與到語音識別,當無意義的識別語音發生時,系統就可以正確識別其為無意義詞匯。但采用這種方式存在以下缺陷:(a)增加工作量;(b)難以覆蓋所有的無意義詞匯。因此,針對上述語音識別過程中可能產生的誤識別錯誤,現有技術中還沒有有效的解決方案。
發明內容
針對現有技術中的語音識別過程中可能產生的誤識別問題,本發明提供了用于語音識別的模板訓練方法、語音識別方法及其系統,優化了用于語音識別的語音識別模板,并因此有效降低了誤識別率。
在本發明實施方式的第一方面,提出一種用于語音識別的模板訓練方法,其特征在于,所述方法包括:
采集與預設命令詞相對應的多個語音樣本以構建訓練樣本集;
通過基于所述訓練樣本集的迭代訓練獲取所述預設命令詞的語音識別模板;以及
根據所述迭代訓練中獲取的所述語音樣本之間的相似度為所述語音識別模板設置匹配閾值。
在一種實施方式中,其中,所述通過基于所述訓練樣本集的迭代訓練獲取語音識別模板具體包括:
從所述訓練樣本集中選取第一語音樣本作為初始的中間模板;
從所述訓練樣本集中依次選取未經訓練的第二語音樣本執行所述迭代訓練以更新所述中間模板;
響應于迭代訓練結束條件,將所述中間模板作為所述預設命令詞的語音識別模板進行存儲。
在一種實施方式中,其中,所述從所述訓練樣本集中依次選取未經訓練的第二語音樣本執行所述迭代訓練以更新所述中間模板具體包括:
針對每一次迭代訓練,根據動態時間規整算法將選取的第二語音樣本向所述中間模板進行規整;
根據規整后的所述第二語音樣本與所述中間模板的矢量均值更新所述中間模板。
在一種實施方式中,其中,所述根據所述迭代訓練中獲取的所述語音樣本之間的相似度為所述語音識別模板設置匹配閾值具體包括:
針對每一次迭代訓練,根據更新前的中間模板與所述第二語音樣本的相似度創建并更新閾值;以及
響應于迭代訓練的結束,根據所述閾值為所述預設命令詞的語音識別模板設置匹配閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘉楠捷思信息技術有限公司,未經北京嘉楠捷思信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811019915.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:加熱裝置的控制方法、系統及烹飪器具
- 下一篇:場效應晶體管及制作方法





