[其他]一種語音特征的提取和識別方法無效
| 申請號: | 85100083 | 申請日: | 1985-04-01 |
| 公開(公告)號: | CN85100083A | 公開(公告)日: | 1986-08-06 |
| 發明(設計)人: | 黃順珍;蔡蓮紅 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L5/06 | 分類號: | G10L5/06 |
| 代理公司: | 清華大學專利事務所 | 代理人: | 王久春 |
| 地址: | 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 特征 提取 識別 方法 | ||
本方法屬于模式識別技術范圍。
利用通用頻譜分析儀對語言進行頻譜分析,并進行識別,其系統價格昂貴,識別率不高。如俞鐵成,通用實時語音識別系統-RTSRS(01),物理學報,1978,No.5。清華大學計算機工程與科學系語音識別科研組,應用微處理機識別語音,清華大學學報,第21卷,第3期,1981年。
本發明提出一種有效地壓縮語譜數據的方法,以推動語音輸入的應用。
本方法具有如下特點:①識別率高,利用本方法對0-9十個數字的自然發音(非電報發音)進行識別,連呼1200次,識別結果錯2次,識別率達99.8%;對牡丹江-北京-廣州128個快車站各進行識別(無挑選)連呼1152次,錯26次,識別率達97.7%。②每單詞語音特征所占內存少,僅24字節。③方法簡單,可在一般微處理機上移植本方法。
語音特征的提取和識別方法如圖1所示。各部分簡述如下:
①提取原始語譜矩陣
語音信息經頻譜分析儀做予處理后送給計算機,軟件以10ms周期對語音信息采樣,并且自動判定語音開始和結束:當連續采得10組高于門檻的數據,即認為語音開始。當連續采得10組低于門檻的數據,即判定語音結束。
一旦判定語音開始,就將采得的一組16個數據做為矩陣的第一行,16個數據對應240Hz-6500Hz的16個頻道,第二次采得的數據做為矩陣的第二行,語音結束前得到N行,構成N×16原始語譜矩陣A:
②數據處理與特征抽取
通過非線性分塊,將時間規劃成m塊,對孤立調匯,常取m=6,即規劃成6塊。信息變化激烈的部分該塊取組數少一些,反之則取組數多一些,用以反映語音變化緩急情況的是矩陣D:
dH=
dH大者,說明以H時刻到H+1時刻語譜變化激烈,反之則變化緩慢。以下式為分塊尺度(分六塊時):
△D= 1/6
滿足下式時第一塊從第一行到P1行:
滿足下式時,第二塊從P1+1行到P2行
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/85100083/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電磁式儀用直流直線電動機
- 下一篇:用影象云紋檢測光學元件性能的方法





