[發(fā)明專利]漢語語音識別方法無效
| 申請?zhí)枺?/td> | 201110125829.0 | 申請日: | 2011-05-16 |
| 公開(公告)號: | CN102208186A | 公開(公告)日: | 2011-10-05 |
| 發(fā)明(設(shè)計(jì))人: | 梁向東;唐勇明 | 申請(專利權(quán))人: | 南寧向明信息科技有限責(zé)任公司 |
| 主分類號: | G10L11/04 | 分類號: | G10L11/04;G10L15/02;G10L15/20 |
| 代理公司: | 廣西南寧匯博專利代理有限公司 45114 | 代理人: | 黃萍 |
| 地址: | 530007 廣西壯族自治*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 漢語 語音 識別 方法 | ||
1.漢語語音識別方法,其特征在于,包括以下步驟:
(1)漢語語音由拾音器輸入,進(jìn)行A/D轉(zhuǎn)換后生成數(shù)字語音信號序列;
(2)音節(jié)界定:先將前述獲得的數(shù)字語音信號序列中無周期性規(guī)律的信號及背景噪聲信號去除,再根據(jù)各音節(jié)間存在的固有的信號停頓或突變,明確每個(gè)音節(jié)的起止,從而獲取各單字的數(shù)字語音信號序列;
(3)對各單字的數(shù)字語音信號序列進(jìn)行漢語單字拼音的識別:
a)識別所需相關(guān)參數(shù)的提取:對該單字的數(shù)字語音信號序列提取包絡(luò)線并進(jìn)行波形分析,包括計(jì)算其上升時(shí)間及超調(diào)量,以及,標(biāo)定出該單字的數(shù)字語音信號序列基頻穩(wěn)定階段的起點(diǎn)和終點(diǎn);以波形兩個(gè)峰點(diǎn)之間計(jì)為一個(gè)周期,對該基頻穩(wěn)定階段的波形進(jìn)行周期界定,并計(jì)算出各個(gè)周期的基波頻率;及,標(biāo)定出該單字的數(shù)字語音信號序列的前端信息段;所述前端信息段,是指從該段數(shù)字語音信號序列的信號截取起點(diǎn)到基頻穩(wěn)定階段起點(diǎn)之間的信號區(qū)段;
聲調(diào)識別:依據(jù)該單字的數(shù)字語音信號序列中周期變化的各信號時(shí)段的基波頻率的變化特征識別出該音節(jié)的聲調(diào);
聲母識別:對該單字的數(shù)字語音信號序列的前端信息段進(jìn)行波形動態(tài)時(shí)域分析,根據(jù)分析得到的包括有包絡(luò)線瞬態(tài)響應(yīng)的上升時(shí)間長短及超調(diào)量大小在內(nèi)的參數(shù),結(jié)合經(jīng)驗(yàn)數(shù)據(jù),識別出聲母;
韻母識別:用該單字的數(shù)字語音信號序列中除所述前端信息段外的余下信息段作為韻母識別處理的信息源;根據(jù)該信息段的基波數(shù)據(jù)分析出該信息段各周期變化時(shí)段的幅頻特性;以該幅頻特性的帶寬及矩形系數(shù)分別與韻母發(fā)音時(shí)共鳴腔的體積大小及張緊程度相對應(yīng),與收集統(tǒng)計(jì)得到的各韻母發(fā)音時(shí)共鳴腔體積大小及張緊程度的經(jīng)驗(yàn)數(shù)值進(jìn)行比對,即可識別出該韻母;
b)將上述識別出的漢語語音聲母、韻母、聲調(diào)進(jìn)行整合,輸出漢語單字拼音;
(4)將識別出的各漢語單字拼音按時(shí)間順序進(jìn)行組合,即形成漢語句子的拼音序列。
2.根據(jù)權(quán)利要求1所述的漢語語音識別方法,其特征在于,所述聲調(diào)識別的方法為:
若本單字的數(shù)字語音信號序列中周期變化的各信號時(shí)段的基波頻率保持穩(wěn)定,則聲調(diào)為第一聲;
若為連續(xù)上升,則聲調(diào)為第二聲;
若為先降后升,則聲調(diào)為第三聲;
若為下降,則聲調(diào)為第四聲。
3.根據(jù)權(quán)利要求1所述的漢語語音識別方法,其特征在于,所述聲母識別的方法步驟為:
(1)標(biāo)定出氣聲數(shù)據(jù)段:
在本單字的數(shù)字語音信號序列的前端信息段里,標(biāo)定出波形平穩(wěn)期的起點(diǎn);該起點(diǎn)與本單字的數(shù)字語音信號序列的起點(diǎn)之間的數(shù)據(jù)段,即為氣聲數(shù)據(jù)段;
(2)將該氣聲數(shù)據(jù)段的時(shí)長與經(jīng)驗(yàn)閾值相比較,將聲母的類型劃分為有氣聲或無氣聲兩種類型;判斷無氣聲時(shí),轉(zhuǎn)至(3);判斷有氣聲時(shí),轉(zhuǎn)至(4);
(3)根據(jù)本單字的數(shù)字語音信號序列前端信息段的包絡(luò)線瞬態(tài)響應(yīng)的上升時(shí)間長短,結(jié)合經(jīng)驗(yàn)數(shù)據(jù),識別出聲母為w、m、n、r或l;
(4)對該單字的數(shù)字語音信號序列的前端信息段進(jìn)行包絡(luò)檢波處理,計(jì)算其上升時(shí)間及超調(diào)量;將超調(diào)量大小與經(jīng)驗(yàn)閾值相比較,判斷是否存在爆鳴聲;判斷有爆鳴聲時(shí),轉(zhuǎn)至(5);判斷無爆鳴聲時(shí),轉(zhuǎn)至(6);
(5)結(jié)合經(jīng)驗(yàn)數(shù)據(jù),根據(jù)超調(diào)量大小識別出聲母為p、t、g或k;
(6)進(jìn)行氣聲長度分析:將所述氣聲數(shù)據(jù)段的長短與經(jīng)驗(yàn)閾值相比較,區(qū)分出短氣聲和長氣聲:
判斷為短氣聲時(shí),將所述包絡(luò)線瞬態(tài)響應(yīng)的上升時(shí)間與經(jīng)驗(yàn)閾值相比較,區(qū)分出聲母為b或d;
判斷為長氣聲時(shí),結(jié)合經(jīng)驗(yàn)數(shù)據(jù),根據(jù)氣聲長度識別出聲母為f、h、z、c、s、j、q、x、zh、ch、或sh。
4.根據(jù)權(quán)利要求1所述的漢語語音識別方法,其特征在于:所述幅頻特性,采用DFT算法分析得到。
5.根據(jù)權(quán)利要求4所述的漢語語音識別方法,其特征在于,所述幅頻特性采用自適應(yīng)DFT算法分析獲得,其方法包括有如下步驟:
(1)從該單字的數(shù)字語音信號序列中除所述前端信息段外的余下信息段的語音數(shù)字序列中連續(xù)截取出時(shí)長為T的若干段數(shù)據(jù),統(tǒng)計(jì)獲得每一段所包含的數(shù)據(jù)個(gè)數(shù)N后,自適應(yīng)動態(tài)生成對應(yīng)的若干個(gè)及表;其中,T為每一段的基波周期;k=0,1,2,…,N;N為自然數(shù);
(2)結(jié)合上表及前文分析得出的對應(yīng)時(shí)段的基波頻率,通過進(jìn)行DFT分析,計(jì)算出該段語音信號1~10次諧波的幅度,再以不小于諧波最大幅值-30db的所有諧波的最高頻率確定帶寬。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南寧向明信息科技有限責(zé)任公司,未經(jīng)南寧向明信息科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110125829.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種小白菊提取物的制備方法
- 下一篇:用于機(jī)動車輛的控制器和控制方法





