[發(fā)明專利]一種對用戶語音識別結(jié)果反饋的命令詞識別自適應(yīng)優(yōu)化方法無效
| 申請?zhí)枺?/td> | 201310473360.9 | 申請日: | 2013-10-11 |
| 公開(公告)號: | CN103531197A | 公開(公告)日: | 2014-01-22 |
| 發(fā)明(設(shè)計(jì))人: | 張偉;梅珂;陳盛;鹿曉亮;單言豐 | 申請(專利權(quán))人: | 安徽科大訊飛信息科技股份有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00 |
| 代理公司: | 北京科迪生專利代理有限責(zé)任公司 11251 | 代理人: | 成金玉;賈玉忠 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 語音 識別 結(jié)果 反饋 命令 自適應(yīng) 優(yōu)化 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音識別方法,特別是一種對用戶語音識別結(jié)果反饋的命令詞識別自適應(yīng)優(yōu)化方法。
背景技術(shù)
命令詞語音識別系統(tǒng)主要是完成對預(yù)先定義的命令詞集合進(jìn)行自動語音識別的功能。用戶在使用該系統(tǒng)時(shí),需要先把定義的命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),我們稱之為識別網(wǎng)絡(luò)。
有了構(gòu)建好的命令詞識別網(wǎng)絡(luò)后,用戶在使用識別系統(tǒng)時(shí)只需要說出命令詞集合中的語音命令,并送入識別系統(tǒng),識別系統(tǒng)就會根據(jù)語音數(shù)據(jù)的聲學(xué)音素去識別網(wǎng)絡(luò)中匹配出最優(yōu)的路徑,從而再根據(jù)網(wǎng)絡(luò)路徑中的聲學(xué)音素序列反推出具體的命令詞文本信息,從而給出識別結(jié)果。
現(xiàn)有的命令詞語音識別技術(shù)都是事先定義全部能夠支持的命令詞,然后構(gòu)建整個(gè)語音識別網(wǎng)絡(luò)。這種方式下識別網(wǎng)絡(luò)是固定的,不能根據(jù)不同用戶的使用習(xí)慣給出更加精確的網(wǎng)絡(luò)。特別是當(dāng)命令詞數(shù)目過大時(shí),識別效果和拒識效果都會明顯下降。
發(fā)明內(nèi)容
本發(fā)明技術(shù)解決問題:克服現(xiàn)有技術(shù)的不足,提供一種對用戶語音識別結(jié)果反饋的命令詞識別自適應(yīng)優(yōu)化方法,能夠根據(jù)不同用戶的使用習(xí)慣自動優(yōu)化命令詞識別網(wǎng)絡(luò),提升了識別效果和拒識效果。
本發(fā)明技術(shù)解決方案:一種對用戶語音識別結(jié)果反饋的命令詞識別自適應(yīng)優(yōu)化方法,本發(fā)明首先將全部支持的命令詞分為兩組,一組詞為用戶常用命令詞,另一組為不常用命令詞;然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡(luò);用戶在使用語音識別系統(tǒng)時(shí),首先會在常用命令詞網(wǎng)絡(luò)中進(jìn)行匹配,如果識別結(jié)果達(dá)到一個(gè)定義的得分門限,則直接返回識別結(jié)果;否則會轉(zhuǎn)到不常用的識別網(wǎng)絡(luò)中繼續(xù)進(jìn)行匹配,直到獲得結(jié)果。在用戶使用語音識別系統(tǒng)的過程中對每次識別結(jié)果的正確性給出確認(rèn),稱用戶接受一次識別結(jié)果為正向反饋,拒絕為反向反饋;隨后語音識別系統(tǒng)會記錄每次用戶給出正向反饋的識別結(jié)果和其出現(xiàn)的頻度;最后,通過統(tǒng)計(jì)用戶使用的反饋信息,重新構(gòu)建識別網(wǎng)絡(luò)和調(diào)整網(wǎng)絡(luò)路徑權(quán)重。
具體實(shí)現(xiàn)如下:
(1)首先給支持的所有命令詞進(jìn)行權(quán)重評分(該評分為根據(jù)經(jīng)驗(yàn)得來),每個(gè)命令詞都會有一個(gè)權(quán)重分,然后根據(jù)評分將全部命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞;
(2)然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡(luò),即常用命令詞網(wǎng)絡(luò)和非常用詞識別網(wǎng)絡(luò):先把常用命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為常用詞識別網(wǎng)絡(luò);再把非常用詞命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個(gè)命令詞轉(zhuǎn)化成相應(yīng)的聲學(xué)音素序列,再將這些音素序列組合成一個(gè)圖網(wǎng)絡(luò),即為非常用詞識別網(wǎng)絡(luò)。
(3)將輸入的語音信號送入常用命令詞網(wǎng)絡(luò)進(jìn)行識別,同時(shí)將識別過程中提取出的語音特征數(shù)據(jù)送入緩存;
(4)如果識別結(jié)果達(dá)到設(shè)定的置信度門限,則直接輸出識別結(jié)果,并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡(luò)進(jìn)行識別;
(5)如果進(jìn)入非常用詞識別網(wǎng)絡(luò)進(jìn)行識別,則若識別結(jié)果達(dá)到設(shè)定的置信度門限,輸出識別結(jié)果,否則拒識;并反饋?zhàn)R別結(jié)果以調(diào)整該命令詞權(quán)重;
所述調(diào)整該命令詞權(quán)重過程為:接收識別結(jié)果反饋,對識別結(jié)果命令詞進(jìn)行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減小;根據(jù)調(diào)整后的權(quán)重重新進(jìn)行命令詞分組;所述正向反饋是指對每次識別結(jié)果的正確性給出確認(rèn),即用戶接受一次識別結(jié)果為正向反饋,拒絕則為反向反饋。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:現(xiàn)有的命令詞語音識別技術(shù)都是事先定義全部能夠支持的命令詞,然后構(gòu)建整個(gè)語音識別網(wǎng)絡(luò)。這種方式下識別網(wǎng)絡(luò)是固定的,不能根據(jù)不同用戶的使用習(xí)慣給出更加精確的網(wǎng)絡(luò)。特別是當(dāng)命令詞數(shù)目過大時(shí),識別效果和拒識效果都會明顯下降。本發(fā)明事先將命令詞分為常用命令詞和非常用命令詞,并分別構(gòu)建識別網(wǎng)絡(luò),通過識別結(jié)果的反饋,對每個(gè)命令詞的權(quán)重進(jìn)行調(diào)整,可以根據(jù)用戶習(xí)慣進(jìn)行命令詞識別網(wǎng)絡(luò)的優(yōu)化,提升識別和拒識效果,提高了識別效率。
附圖說明
圖1為本發(fā)明中語音識別過程流程圖;
圖2為本發(fā)明中詞匯網(wǎng)絡(luò)權(quán)重調(diào)整流程圖。
具體實(shí)施方式
下面結(jié)合流程圖詳細(xì)說明識別過程和詞匯分組自優(yōu)化調(diào)整過程。
如圖1所示,本發(fā)明具體實(shí)現(xiàn)步驟如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽科大訊飛信息科技股份有限公司,未經(jīng)安徽科大訊飛信息科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310473360.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





