[發(fā)明專利]連續(xù)二次貝氏分類法辨認相似國語單音的方法及裝置無效
| 申請?zhí)枺?/td> | 200710080272.7 | 申請日: | 2007-02-15 |
| 公開(公告)號: | CN101246686A | 公開(公告)日: | 2008-08-20 |
| 發(fā)明(設計)人: | 黎自奮 | 申請(專利權)人: | 黎自奮;李臺珍;廖麗娟 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/02;G10L15/06;G10L15/08;G10L19/12 |
| 代理公司: | 北京集佳知識產權代理有限公司 | 代理人: | 逯長明 |
| 地址: | 中國臺灣臺*** | 國省代碼: | 中國臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 連續(xù) 二次 分類法 辨認 相似 國語 單音 方法 裝置 | ||
1.?一個語音辨認系統(tǒng),其特征在于包含:
(1)一個先前處理器刪去不具語音音波信號點或雜音;
(2)一個已知單音音波正常化及抽取特征方法:用彈性框將音波正常化并轉換成大小相等的LPC倒頻譜LPCC特征矩陣,并將相同單音音波轉換成特征相同的矩陣;
(3)一個已知單音特征矩陣多個樣本轉換成一個標準模型,儲藏在數(shù)據(jù)庫,標準模型含有該已知單音特征矩陣的樣本平均數(shù)及變異數(shù);
(4)一個未知單音音波正常化及抽取特征方法:將音波正常化并轉換成大小與已知標準模型大小相等的特征矩陣,稱為未知單音分類模型,內含有線性預估編碼倒頻譜LPCC;
(5)一個簡化貝氏分類法:將未知單音分類模型與數(shù)據(jù)庫所有已知單音標準模型比較,找M個與未知單音最相似的已知單音c′i,i=1,...,M判為未知單音的M個相似已知單音(找M個最小l(ci)(20)的值);
(6)在每個相似已知單音c′i,計算全部樣品(xik)的l(xik),i=1,...,M,k=1,...,Ki,(22)的值,取最小K個樣品的l(xik)值的總和,叫做此相似已知單音與未知單音總貝氏距離或mis-categorizationrisk,在M個相似已知單音找一個最小總貝氏距離的相似已知單音判為未知單音。
2.?根據(jù)權利要求1所述的語音辨認系統(tǒng)中,其特征在于步驟(1)刪去不具語音的音波或雜音,包含兩種方法:
(a)在一小時段內信號點,計算信號點的變異數(shù)及一般雜音的變異數(shù):如信號點的變異數(shù)小于雜音變異數(shù),則刪去該時段;
(b)在一小時段內信號點,計算相鄰兩信號點距離總和和一般雜音相鄰兩信號點距離總和:如前者小于后者則刪去該時段。
3.?根據(jù)權利要求1所述的語音辨認系統(tǒng)中,其特征在于步驟(2)包含已知單音音波正常化及抽取大小一致的特征矩陣,步驟如下:
(a)一個均等分一個已知單音音波信號點方法,為了用線性變化的回歸模式密切估計非線性變化的音波,將音波全長分成E等時段;每時段形成一個彈性框;一個單音共有E個彈性框,沒有濾波器,不重疊,可以自由伸縮含蓋全長音波;不是固定長度的Hamming窗;
(b)每框內,用一隨時間作線性變化的回歸模式估計隨時間作非線性變化的音波;
(c)用Durbin’s循環(huán)方式(8-13)求回歸系數(shù)最小平方估計值,叫做線性預估編碼向量,再用(14-15)式轉換LPC向量為穩(wěn)定的LPC倒頻譜LPCC向量;
(d)用E個LPCC向量表示一個單音的E×P?LPCC特征矩陣。
4.?根據(jù)權利要求1所述的語音辨認系統(tǒng),其特征在于步驟(3)又包含一個計算已知單音的標準模型方法,步驟如下:
(a)一個已知單音,由多人發(fā)音,產生長短不一的音波;因代表相同已知單音,長短不一的音波包含一種隨時間作非線性變化但相同動態(tài)特征,只是時間位置不同;
(b)用E個彈性框將該單音長短不一的音波調整并轉換成多個LPCC特征大致相同的矩陣樣本;再求LPCC樣本平均數(shù)及樣本變異數(shù),將樣本平均數(shù)及樣本變異數(shù)用二個E×P矩陣表示,稱為該單音標準模型。
5.?根據(jù)權利要求1所述的語音辨認系統(tǒng)中,其特征在于步驟(4)又包含未知單音音波正常化并抽取E個LPCC特征向量,成為未知單音的分類模型,其步驟如下:
(a)將未知單音音波分成E等時段,每時段組成一個彈性框,一個未知單音有E個等長彈性框,沒有濾波器,不重疊,自由伸縮含蓋全部音波信號點;
(b)每個彈性框內,用一個隨時間作線性變化的回歸模式估計隨時間作非線性變化的音波;
(c)用Durbin’s循環(huán)方式(8-13)計算回歸系數(shù)最小平方估計值LPC;
(d)再將LPC向量用公式(14-15)轉換成穩(wěn)定LPC倒頻譜LPCC量;
(e)用E個LPCC向量,作為該未知單音的分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黎自奮;李臺珍;廖麗娟,未經黎自奮;李臺珍;廖麗娟許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710080272.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





