[發(fā)明專利]一種語音識別糾錯方法及人機(jī)對話系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910717838.5 | 申請日: | 2019-08-05 |
| 公開(公告)號: | CN110428822B | 公開(公告)日: | 2022-05-03 |
| 發(fā)明(設(shè)計)人: | 蘭飛 | 申請(專利權(quán))人: | 重慶電子工程職業(yè)學(xué)院 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/22;G10L15/26;G10L15/04;G06F40/232 |
| 代理公司: | 重慶強(qiáng)大凱創(chuàng)專利代理事務(wù)所(普通合伙) 50217 | 代理人: | 陳家輝 |
| 地址: | 401331 重*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 識別 糾錯 方法 人機(jī)對話 系統(tǒng) | ||
本發(fā)明涉及語音識別糾錯技術(shù)領(lǐng)域,具體為一種語音識別糾錯方法及人機(jī)對話系統(tǒng),該方法包括以下步驟:獲取語音識別結(jié)果和候選語義片段以及語音識別結(jié)果的拼音和候選語義片段的拼音;將語音識別結(jié)果和候選語義片段進(jìn)行組合,形成若干新的糾錯文本,計算糾錯文本的組合分?jǐn)?shù),根據(jù)組合分?jǐn)?shù)篩選糾錯文本得到糾錯候選列表;語言模型優(yōu)化步驟,利用語言模型計算語言模型評分,并根據(jù)組合分?jǐn)?shù)和語言模型評分生成最終糾錯列表。本發(fā)明提供的一種語音識別糾錯方法及人機(jī)對話系統(tǒng),可以在語音識別錯誤后,更加準(zhǔn)確的匹配出糾錯文本,有效的減少語音識別的結(jié)果對中文人機(jī)對話流程的跳轉(zhuǎn)影響,提高人機(jī)對話質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別糾錯技術(shù)領(lǐng)域,具體為一種語音識別糾錯方法及人機(jī)對話系統(tǒng)。
背景技術(shù)
人機(jī)對話技術(shù)的研究最早可以追溯到上世紀(jì)六十年代,自阿蘭·圖靈提出通過圖靈測試來檢驗機(jī)器是否具有人類智能的設(shè)想以來,研究人員就開始致力于人機(jī)對話系統(tǒng)的研究。目前,市面上有眾多人機(jī)對話的產(chǎn)品,如智能語音助手、電話機(jī)器人等,這些產(chǎn)品中語音識別技術(shù)都是非常重要的模塊。由于用戶的非標(biāo)準(zhǔn)化表達(dá)、方言、環(huán)境噪聲等因素,導(dǎo)致錯誤的語音識別結(jié)果,這是導(dǎo)致人機(jī)對話失敗的主要原因。
我國語音識別研究工作起步于五十年代,近年來由于深度學(xué)習(xí)技術(shù)的推動,語音識別技術(shù)發(fā)展很快。我國語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術(shù)上還有自己的特點(diǎn)與優(yōu)勢,并達(dá)到國際先進(jìn)水平。國內(nèi)語音識別技術(shù)領(lǐng)先的單位有科大訊飛、阿里、百度等互聯(lián)網(wǎng)巨頭廠商。這些廠商在漢語語音識別上投入了巨大的人力和財力,在各類學(xué)術(shù)競賽中獲得領(lǐng)先水平,在實(shí)際的工業(yè)生產(chǎn)中,收集了大量的模型訓(xùn)練語料,在短時間內(nèi)形成了語音識別的技術(shù)高地。目前,考慮到語音識別的效果,國內(nèi)很多的人機(jī)交互產(chǎn)品選擇采用互聯(lián)網(wǎng)巨頭語音識別技術(shù)。但是,在特定的交互場景下,互聯(lián)網(wǎng)巨頭語音識別技術(shù)仍有很大的不足,尤其是大量環(huán)境噪聲下的短文本識別。此時,由于無法直接修改語音識別模型,只能夠致力于將語音識別結(jié)果映射到場景相關(guān)的文本上去。在人機(jī)對話過程中,預(yù)設(shè)了用戶的說話語義范圍,而在語音識別中并沒有這個假設(shè),所以,采用中文人機(jī)對話中的候選語料糾正語音識別結(jié)構(gòu),對于提高人機(jī)對話質(zhì)量有重要的意義。
發(fā)明內(nèi)容
本發(fā)明意在提供一種語音識別糾錯方法及一種人機(jī)對話系統(tǒng),可以在語音識別錯誤后,更加準(zhǔn)確的匹配出糾錯文本,有效的減少語音識別的結(jié)果對中文人機(jī)對話流程的跳轉(zhuǎn)影響,提高人機(jī)對話質(zhì)量。
為了解決上述技術(shù)問題,本申請?zhí)峁┤缦录夹g(shù)方案:
一種語音識別糾錯方法,包括以下步驟:
獲取語音識別結(jié)果和候選語義片段以及語音識別結(jié)果的拼音和候選語義片段的拼音;
將語音識別結(jié)果和候選語義片段進(jìn)行組合,形成若干新的糾錯文本,計算語音識別結(jié)果和候選語義片段的拼音相似度和糾錯文本的組合分?jǐn)?shù),根據(jù)組合分?jǐn)?shù)篩選糾錯文本得到糾錯候選列表;
語言模型優(yōu)化步驟,利用語言模型計算語言模型評分,并根據(jù)組合分?jǐn)?shù)和語言模型評分生成最終糾錯列表。
本發(fā)明技術(shù)方案中,通過使用拼音空間相似度算法,并采用了動態(tài)規(guī)劃方法計算最優(yōu)語義文本組合,形成糾錯候選列表,可以更加準(zhǔn)確的匹配出正確的語義文本,并且,通過采用拼音空間相似度算法和語言模型融合的方式,不僅僅從發(fā)音上,更結(jié)合字符串之間本身的語義關(guān)系,可以避免糾錯候選列表中存在語序不通、同音錯別字等問題,進(jìn)一步提高匹配的準(zhǔn)確度。將其應(yīng)用于人機(jī)對話系統(tǒng)后,可以有效的減少語音識別的結(jié)果對中文人機(jī)對話流程的跳轉(zhuǎn)影響,提高人機(jī)對話質(zhì)量。
進(jìn)一步,計算各個語義文本的拼音相似度評分具體包括以下步驟:
計算語音識別結(jié)果的拼音對應(yīng)的字符串的子字符串和候選語義片段之間的拼音相似度,形成相似度矩陣Mk;
根據(jù)拼音相似度計算組合分?jǐn)?shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶電子工程職業(yè)學(xué)院,未經(jīng)重慶電子工程職業(yè)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910717838.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





