[發(fā)明專利]面向孤立詞語音識(shí)別的自適應(yīng)端點(diǎn)檢測方法及其系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210085584.8 | 申請日: | 2012-03-28 |
| 公開(公告)號(hào): | CN103366739A | 公開(公告)日: | 2013-10-23 |
| 發(fā)明(設(shè)計(jì))人: | 霍小四;尹明理;劉軍江 | 申請(專利權(quán))人: | 鄭州市科學(xué)技術(shù)情報(bào)研究所 |
| 主分類號(hào): | G10L15/04 | 分類號(hào): | G10L15/04;G10L25/87 |
| 代理公司: | 鄭州中原專利事務(wù)所有限公司 41109 | 代理人: | 霍彥偉;李想 |
| 地址: | 450006 *** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 孤立 詞語 識(shí)別 自適應(yīng) 端點(diǎn) 檢測 方法 及其 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種面向孤立詞語音識(shí)別的語音端點(diǎn)檢測算法,更具體地說,是一種能夠根據(jù)背景噪聲自動(dòng)調(diào)節(jié)檢測門限的、針對(duì)非特定人孤立詞語音識(shí)別的端點(diǎn)檢測算法。
背景技術(shù)
孤立詞語音識(shí)別是通過機(jī)器把含有孤立詞的語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù),有著非常廣泛的應(yīng)用領(lǐng)域和市場背景,如各種命令控制系統(tǒng)、語音玩具等等。在孤立詞語音識(shí)別系統(tǒng)中,輸入的信號(hào)包括孤立詞語音和背景噪聲等,從輸入信號(hào)中找出語音的起點(diǎn)和終點(diǎn),稱為端點(diǎn)檢測。在孤立詞語音識(shí)別系統(tǒng)中,端點(diǎn)檢測的準(zhǔn)確性直接關(guān)系到識(shí)別率的高低。
常用的端點(diǎn)檢測算法有基于短時(shí)平均幅值和短時(shí)過零率的雙門限檢測算法,該算法用短時(shí)平均幅值區(qū)分濁音與無聲段,用短時(shí)平均過零率區(qū)分清音與無聲段。該算法對(duì)信噪比高的語音信號(hào)有很好的檢測效果,但受噪聲影響很大,對(duì)于含噪聲的語音信號(hào)的檢測效果較差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于克服現(xiàn)有雙門限檢測算法受噪聲影響大的缺陷,根據(jù)背景噪聲的強(qiáng)弱自適應(yīng)地改變檢測閾值,并結(jié)合根據(jù)孤立詞語音長度的限制,提供一種具有高穩(wěn)健性的孤立詞語音識(shí)別端點(diǎn)檢測算法。
為達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案,它包括以下步驟:
a.語音輸入:輸入包含待識(shí)別孤立詞的語音信號(hào);
b.語音預(yù)處理:對(duì)語音信號(hào)進(jìn)行幅值平移,歸一化和分幀處理,計(jì)算每一幀語音信號(hào)的短時(shí)平均能量和短時(shí)平均過零率;
c.?孤立詞端點(diǎn)粗檢測:利用每一幀語音信號(hào)的短時(shí)平均能量和短時(shí)平均過零率,以及端點(diǎn)前后連續(xù)語音幀的最短長度約束,對(duì)孤立詞端點(diǎn)進(jìn)行粗略估計(jì);
d.?檢測門限的自適應(yīng)調(diào)整及精確端點(diǎn)的檢測:利用孤立詞最小時(shí)長和最大時(shí)長的限制,對(duì)檢測門限進(jìn)行動(dòng)態(tài)調(diào)整,并對(duì)語音端點(diǎn)進(jìn)行前后微調(diào),得到精確的孤立詞端點(diǎn);
e.?輸出孤立詞的端點(diǎn)進(jìn)行孤立詞語音識(shí)別:輸出精確的孤立詞端點(diǎn),利用語音識(shí)別技術(shù)進(jìn)行孤立詞識(shí)別。
c步驟中,進(jìn)行端點(diǎn)的粗略估計(jì)時(shí),引入端點(diǎn)前后連續(xù)語音幀長度的約束。
e步驟中,進(jìn)行端點(diǎn)的精確檢測時(shí),根據(jù)孤立詞的長度約束對(duì)檢測門限進(jìn)行自適應(yīng)調(diào)整。當(dāng)檢測到的孤立詞語音長度大于孤立詞的最大長度時(shí),增大短時(shí)能量高閾值,并向后調(diào)整起點(diǎn)、向前調(diào)整終點(diǎn),分別使得起點(diǎn)和終點(diǎn)的幀平均能量大于新的高閾值。當(dāng)檢測到的孤立詞語音長度大于孤立詞的最大長度時(shí),縮小短時(shí)過零率閾值,并向后調(diào)整起點(diǎn)、向前調(diào)整終點(diǎn),使得起點(diǎn)前一幀和終點(diǎn)下一幀平均過零率大于新的短時(shí)過零率閾值。當(dāng)檢測到的孤立詞語音長度小于孤立詞的最短長度時(shí),縮小短時(shí)能量高閾值,并向前調(diào)整起點(diǎn)、向后調(diào)整終點(diǎn),分別使得起點(diǎn)和終點(diǎn)的幀平均能量大于新的高閾值。當(dāng)檢測到的孤立詞語音長度小于孤立詞的最短長度時(shí),增大短時(shí)過零率閾值,并向前調(diào)整起點(diǎn)、向后調(diào)整終點(diǎn),使得起點(diǎn)前一幀和終點(diǎn)下一幀平均過零率大于新的短時(shí)過零率閾值。
面向孤立詞語音識(shí)別的自適應(yīng)端點(diǎn)檢測系統(tǒng),該系統(tǒng)包括:待識(shí)別孤立詞語音信號(hào)的輸入裝置;對(duì)語音信號(hào)進(jìn)行幅值平移,歸一化和分幀處理,對(duì)每一幀語音的短時(shí)平均能量和短時(shí)平均過零率進(jìn)行計(jì)算的裝置;利用每一幀語音信號(hào)的短時(shí)平均能量和短時(shí)平均過零率,以及端點(diǎn)前后連續(xù)語音幀的最短長度約束,對(duì)孤立詞端點(diǎn)進(jìn)行粗略估計(jì)的裝置;利用孤立詞最小時(shí)長和最大時(shí)長的限制,對(duì)檢測門限進(jìn)行動(dòng)態(tài)調(diào)整,并對(duì)語音端點(diǎn)進(jìn)行前后微調(diào),得到精確孤立詞端點(diǎn)的裝置;輸出精確的孤立詞端點(diǎn),利用語音識(shí)別技術(shù)進(jìn)行孤立詞識(shí)別的裝置。
本發(fā)明的有益效果是:由于傳統(tǒng)的基于雙門限檢測的孤立詞語音端點(diǎn)檢測算法受噪聲的影響較大,本發(fā)明給出一種具有一定抗噪能力、自適應(yīng)調(diào)整檢測門限的新端點(diǎn)檢測算法。與現(xiàn)有技術(shù)相比,本發(fā)明在檢測端點(diǎn)時(shí)引入連續(xù)語音幀的時(shí)長限制,增加檢測的穩(wěn)健性;同時(shí)通過引入與待檢測孤立詞相關(guān)的時(shí)長限制,自動(dòng)地調(diào)整檢測的門限。算法實(shí)現(xiàn)簡單、效果好、速度快,且具有一定的抗噪能力,特別適合于小型設(shè)備及嵌入式設(shè)備實(shí)現(xiàn),可以作為孤立詞語音識(shí)別系統(tǒng)的前端。
附圖說明
圖1為本發(fā)明方法整體框架的流程圖。
圖2為本發(fā)明方法中自適應(yīng)調(diào)整檢測門限和孤立詞端點(diǎn)精確檢測的流程圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方法作進(jìn)一步描述。
如圖1、圖2所示,本發(fā)明包括以下步驟:
1.語音輸入
輸入包含所要檢測孤立詞的語音信號(hào)。
2.語音預(yù)處理與檢測門限參數(shù)選取
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭州市科學(xué)技術(shù)情報(bào)研究所,未經(jīng)鄭州市科學(xué)技術(shù)情報(bào)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210085584.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種風(fēng)吹篩選麥片裝置
- 下一篇:電磁式船板噴涂車
- 修正掩模圖案的方法、光掩模和半導(dǎo)體器件及其制造方法
- 圖像處理裝置以及圖像處理程序
- 一種本區(qū)和鄰區(qū)的路損上報(bào)方法及設(shè)備
- 無線網(wǎng)絡(luò)配置方法、裝置和系統(tǒng)
- 用于孤立負(fù)載物品的設(shè)備
- 一種基于設(shè)計(jì)模型匹配孤立點(diǎn)識(shí)別與刪除方法及系統(tǒng)
- 喀斯特地貌下孤立山峰上空風(fēng)場模擬范圍選取方法
- 一種面向Wi-Fi信號(hào)的手語孤立詞識(shí)別網(wǎng)絡(luò)構(gòu)建及分類方法
- 一種針對(duì)下降型海洋內(nèi)孤立波的振幅反演方法及裝置
- 孤立圖形設(shè)計(jì)方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





