[發明專利]一種利用話術語句提升語音識別準確率的識別方法在審
| 申請號: | 202010467020.5 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111696531A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 高洋洋 | 申請(專利權)人: | 升智信息科技(南京)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/183 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 朱楨榮 |
| 地址: | 210012 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 術語 提升 語音 識別 準確率 方法 | ||
本發明公開了一種利用話術語句提升語音識別準確率的識別方法,涉及語音識別技術領域,提出用話術中配置的語句動態更新語言模型提高語音識別的準確率;在構建語音識別系統過程中,仍然以通用性的文本資源訓練第一語言模型;在自定義對話機器人的話術之后,用對話語句文本訓練第二語言模型;最終的語言模型融合第一語言模型和第二語言模型,使得語音識別系統對自定義場景下的語音有更好的準確率。
技術領域
本發明涉及語音識別技術領域,特別是一種利用話術語句提升語音識別準確率的識別方法。
背景技術
語音識別、語義理解和語音合成技術的發展,讓智能語音對話機器人進入日常生活,為用戶提供越來越便捷的智能語音對話服務。用戶可以根據自身場景的需求,編寫自定義的話術,創建符合自己需求的智能語音對話機器人。
語音識別把用戶說的語音轉化為對應的文本,然后語義理解依據用戶定義的話術語句判斷用戶的意圖并產生應答的文本,最后語音合成應答的文本轉化為語音并播放給用戶。
現有智能語音對話機器人系統中的語音識別具有通用性,可用于各種各樣的場景,與智能語音對話機器人的類型、應用領域和交互話術的配置無關。為了能夠用于多種場景,語音識別系統需要在這些場景下的準確率達到一個平衡,這導致語音識別系統在特定場景下的準確率不會太高。
在實際智能語音對話機器人中,用戶預設了機器人的對話場景和說話語義范圍,在通用性語音識別中并沒有這個假設。利用智能語音對話機器人話術中配置的候選語料增強語音識別系統,對于提高語音識別準確率和人機對話質量有重要的意義。
發明內容
本發明所要解決的技術問題是克服現有技術的不足而提供一種利用話術語句提升語音識別準確率的識別方法,本發明提出用話術中配置的語句動態更新語言模型提高語音識別的準確率。
本發明為解決上述技術問題采用以下技術方案:
根據本發明提出的一種利用話術語句提升語音識別準確率的識別方法,包括以下步驟:
步驟1、使用通用性文本訓練第一語言模型;訓練第一語言模型具體如下:
設i為正在統計的序列的長度,i為大于等于1的整數;
當i等于1時,首先統計詞語序列的第1個詞語w1出現的次數C(w1),然后統計w1按順序出現之后連接任一詞語w的次數之和∑wC(w1,w);
當i大于1時,首先統計通用型文本中詞語序列w1、w2、…、wi按順序出現的次數C(w1,w2,...,wi),然后統計文本中詞語序列w1、w2、…、wi-1按順序出現之后連接任一詞語w的次數之和∑wC(w1,w2,...,wi-1,w);ws為詞語序列的第s個詞語,s為大于0小于(i+1)的整數;
對于由詞語序列w1,w2,...,wn組成的句子,n為該句子中詞語的個數,其序列概率Pgeneral通過下面的公式計算得到:
其中,P(wi|w1,w2,...,wi-1)為第i個詞出現的條件概率,P(w1)為第1個詞出現的條件概率,P(w2|w1)為第2個詞出現的條件概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于升智信息科技(南京)有限公司,未經升智信息科技(南京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010467020.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:業務類型數據的處理方法及系統
- 下一篇:密鑰輪換方法、裝置、電子設備及介質





