[發明專利]一種N最優口語語義識別方法、裝置及電子設備有效
| 申請號: | 202011220689.0 | 申請日: | 2020-11-05 |
| 公開(公告)號: | CN112037773B | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 張常睿;李蒙 | 申請(專利權)人: | 北京淇瑀信息科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/14;G10L15/16;G10L15/183;G06N3/04 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 最優 口語 語義 識別 方法 裝置 電子設備 | ||
本發明公開了一種N最優口語語義識別方法、裝置及電子設備,所述方法包括:獲取自動語音識別ASR模型對歷史音頻數據輸出的前N個概率值的文本數據和各個文本數據的標簽作為訓練集;通過所述訓練集訓練口語理解SLU模型;將ASR模型對測試音頻數據輸出的前M個概率值的文本數據輸入所述SLU模型中,得到對該M個文本數據的意圖識別概率序列;將所述意圖識別概率序列中概率最大的意圖作為所述測試音頻數據的意圖輸出。本發明在SLU模型訓練和SLU模型應用中均考慮到ASR模型的前幾個概率值的文本數據,再根據前幾個概率值的文本數據進行意圖識別,能夠有效降低因ASR識別錯誤而導致的用戶意圖識別錯誤,提高意圖識別準確率。
技術領域
本發明涉及語音智能技術領域,具體而言,涉及一種N最優口語語義識別方法、裝置、電子設備及計算機可讀介質。
背景技術
隨著人工智能技術的發展,語音機器人的應用也越來越廣泛。語音機器人基于語音識別、語音合成、自然語言理解等技術,能夠為企業在多種實際應用場景下,賦予產品“能聽、會說、懂你”式的智能人機交互體驗。目前,語音機器人已廣泛應用于電話銷售、智能問答、智能質檢、實時演講字幕、訪談錄音等場景。
語音機器人首先對用戶的語音進行自然語音理解來識別用戶意圖,再根據用戶意圖通過自然語音生成技術生成對用戶的問答語音,從而完成與用戶的語音問答。在自然語音理解過程中語音機器人將用戶的語音通過語音識別(Automatic Speech Recognition,ASR)技術轉化為文字,再通過口語理解(Spoken Language Understanding,SLU)技術識別用戶意圖。其中,ASR技術先通過訓練數據預先分析出語音特征參數,制作語音模板,并存放在語音參數庫中,再將待識語音經過與訓練時相同的分析,得到語音參數。將它與語音參數庫中的語音模板一一比較,通過模型打分的方式找出最接近語音特征的模板,得出識別的文字結果。由于ASR技術采用模型打分的方式將最接近的語音特征模板對應的文本數據作為識別的文字,而最接近的語音特征模板對應的文本數據有時會與實際的用戶語音文字不同,甚至意思相反。因此,現有ASR在轉換文字過程中會出現一定的錯誤,這就導致后續SLU對用戶意圖識別錯誤,影響語音機器人與用戶的對話效果。
發明內容
本發明旨在降低因ASR識別錯誤而導致用戶意圖識別錯誤的技術問題。
為了解決上述技術問題,本發明第一方面提出一種N最優口語語義識別方法,所述方法包括:
獲取自動語音識別ASR模型對歷史音頻數據輸出的前N個概率值的文本數據和各個文本數據的標簽作為訓練集;
通過所述訓練集訓練口語理解SLU模型;
將ASR模型對測試音頻數據輸出的前M個概率值的文本數據輸入所述SLU模型中,得到對該M個文本數據的意圖識別概率序列;
將所述意圖識別概率序列中概率最大的意圖作為所述測試音頻數據的意圖輸出。
根據本發明一種優選的實施方式,所述ASR模型包括聲學模型和語言模型。
根據本發明一種優選的實施方式,所述聲學模型為長短記憶LSTM神經網絡或者隱馬爾可夫模型HMM。
根據本發明一種優選的實施方式,所述語言模型為n-gram模型、神經網絡語言模型NNLM、word2vec模型中的任意一種。
根據本發明一種優選的實施方式,所述SLU模型為多任務深度神經網絡MT-DNN或者變換器的雙向編碼表征BERT模型。
根據本發明一種優選的實施方式,所述方法還包括:
通過槽位填充模型獲取所述測試音頻數據的意圖對應的槽位值;
將所述測試音頻數據的意圖和對應的槽位值發送給語音對答系統。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京淇瑀信息科技有限公司,未經北京淇瑀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011220689.0/2.html,轉載請聲明來源鉆瓜專利網。





