[發明專利]一個百分之百辨認率的國語單音與句子辨認方法無效
| 申請號: | 200810085532.4 | 申請日: | 2008-03-17 |
| 公開(公告)號: | CN101281746A | 公開(公告)日: | 2008-10-08 |
| 發明(設計)人: | 黎自奮;李臺珍;廖麗娟 | 申請(專利權)人: | 黎自奮;李臺珍;廖麗娟 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/02;G10L15/10 |
| 代理公司: | 北京科龍寰宇知識產權代理有限責任公司 | 代理人: | 孫皓晨 |
| 地址: | 臺灣省*** | 國省代碼: | 中國臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一個 百分之百 辨認 國語 單音 句子 方法 | ||
1、一個百分之百辨認率的國語單音與句子辨認方法,其特征在于:其步驟包含:
步驟(1):通過一個先前處理器刪去不具語音音波信號點或雜音;
步驟(2):實施一個已知單音音波正常化與抽取特征方法:用彈性框將音波正?;⑥D換成大小相等的線性預估編碼倒頻譜LPCC特征矩陣,并將相同單音音波轉換成特征相同的矩陣;
步驟(3):在數據庫中,對每個已知單音,選擇K個最好樣本;
步驟(4):一個已知單音特征矩陣的K個最好樣本轉換成一個標準模型,儲藏在數據庫,標準模型含有所述的已知單音特征矩陣的K個樣本平均數與變異數;
步驟(5):實施一個未知單音音波正常化與抽取特征方法:將音波正?;⑥D換成大小與已知標準模型大小相等的特征矩陣,稱為未知單音分類模型,內含有線性預估編碼倒頻譜LPCC;
步驟(6):實施一個簡化貝氏分類法:將未知單音分類模型與數據庫所有已知單音標準模型比較,找一個已知單音,它和未知單音貝式距離達最小,辨認為未知單音;
步驟(7):將一個未知句子或名稱切成D個未知單音方法;
步驟(8):通過一個簡化貝式分類法,在D個未知單音中,為每一個未知單音選F個最相似的已知單音,一個未知句子或名稱用D×F矩陣已知單音表示;
步驟(9):用D×F矩陣的已知單音,比對句子與名稱數據庫全部句子與名稱,找尋一個最可能已知句子或名稱;
步驟(10):實施一個修正單音特征的方法,使講話者的句子或名稱辨認正確。
2、根據權利要求1所述的百分之百辨認率的國語單音與句子辨認方法,其特征在于:步驟(1)刪去不具語音的音波或雜音,包含兩種方法:
(a)、在一小時段內信號點,計算信號點的變異數與一般雜音的變異數,如信號點的變異數小于雜音變異數,則刪去所述的時段;
(b)、在一小時段內信號點,計算相鄰兩信號點距離總和和一般雜音相鄰兩信號點距離總和,如前者小于后者則刪去所述的時段。
3、根據權利要求1所述的國語單音與句子辨認方法,其特征在于:步驟(2)包含已知單音音波正?;c抽取大小一致的特征矩陣,步驟如下:
(a)一個均等分一個已知單音音波信號點方法,為了用線性變化的回歸模式密切估計非線性變化的音波,將音波全長分成E等時段,每時段形成一個彈性框,一個單音共有E個彈性框,沒有濾波器,不重迭,自由伸縮含蓋全長音波,不是固定長度的漢明窗;
(b)每框內,用一隨時間作線性變化的回歸模式估計隨時間作非線性變化的音波;
(c)用Durbin′s循環方式
E0=R(0)
求回歸系數最小平方估計值,叫做線性預估編碼LPC向量,再用
轉換線性預估編碼LPC向量為穩定的線性預估編碼倒頻譜LPCC向量;
(d)用E個線性預估編碼倒頻譜LPCC向量表示一個單音的E×P?LPCC特征矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黎自奮;李臺珍;廖麗娟,未經黎自奮;李臺珍;廖麗娟許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810085532.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:手持式工具機
- 下一篇:用于檢測放氣閥故障的系統





