[發明專利]一種語音識別閾值設置方法有效
| 申請號: | 202111147823.3 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113823276B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 陳思應 | 申請(專利權)人: | 成都啟英泰倫科技有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 閾值 設置 方法 | ||
一種語音識別閾值設置方法,包括如下步驟:S1.確定識別函數和誤識別函數;S2.對識別函數和誤識別函數分別計算收益和損失,計算總收益gains,S3.對總收益gains,以置信度為變量進行求導,導數為零時的置信度值為置信度閾值。本發明通過對識別和誤識別的分析,通過最大收益的方法確定每個命令詞的最佳置信度閾值,雖然略微降低新聞噪音下的識別率,但大幅降低了誤識別率,提升了整體識別體驗效果。
技術領域
本發明屬于語音識別技術領域,涉及語音識別閾值設置,具體涉及一種語音識別閾值設置方法。
背景技術
隨著技術迭代更新,語音識別技術日趨成熟,在實際產品如音響、玩具、家居中控等也得到廣泛使用。目前主流的語音識別技術主要是通過深度神經網絡學習的方式實現,深度神經網絡學習包括訓練和識別兩個步驟,訓練是通過語音到音節概率的計算得到聲學模型,識別是根據聲學模型和語言模型計算當前語音對應音節到文本的概率,實際應用中,對于語音識別本身而言,只有識別與未識別兩種狀態,故須將概率轉變成二值量。通常的做法是設定一個概率(置信度)閾值,即,當獲得的置信度值達到或超過閾值時,表明語音識別成功;反之為不成功。
閾值的確定通常是一個比較困難的問題,如果閾值設置過大,則會導致識別率下降,如果閾值設置過小,雖不影響識別率,但會增加集外誤識別概率,降低識別體驗。
發明內容
為克服現有技術存在的技術缺陷,兼顧識別率和誤識別,本發明提出了一種語音識別閾值設置方法。
本發明所述語音識別閾值設置方法,包括如下步驟:
S1.確定識別函數和誤識別函數;
S2.對識別函數和誤識別函數分別計算收益和損失,收益指正確率,損失是失誤率;
計算總收益gains,
gains=?gainerr-losserr+gainrec-lossrec
置信度區間是置信度可能取值的范圍,置信度閾值t位于置信度區間內;
?(4)
?(5)
其次,計算誤識別函數收益gainerr和誤識別函數損失losserr
(6)
(7)
最后,由式(1)-(2)式及(4)-(7)式可計算總收益gains
gains=-(-at3/3+bt2/2+ct)+(-at3/3+mt2/2+nt)-
(-at3/3+bt2/2+ct)+(-at3/3+mt2/2+nt)+const??---(8);
其中,gainrec、lossrec、gainerr、losserr分別為識別函數收益、識別函數損失、誤識別函數收益、誤識別函數損失;const為常數;
S3.對總收益gains,以置信度為變量進行求導,導數為零時的置信度值為置信度閾值;
識別函數rec和誤識別函數err分別為:
rec(x)=-ax2+bx+c
err(x)=-ax2+mx+n
其中,x為置信度,rec(x)為識別次數、err(x)為誤識別次數;對于置信度區間內的所有置信度x,?識別次數和誤識別次數都是大于等于零的;
a,b,c,m,n為大于零的常數,且b≠m,?c≠n;?所述置信度閾值t?=?(n-c)/(b-m)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都啟英泰倫科技有限公司,未經成都啟英泰倫科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111147823.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電動汽車及其熱泵空調系統
- 下一篇:一種防異響低收縮聚丙烯組合物及其制備方法





