[發明專利]一種語音識別的特征向量量化快速收斂方法有效
| 申請號: | 201410281283.1 | 申請日: | 2014-06-20 |
| 公開(公告)號: | CN104064181B | 公開(公告)日: | 2017-04-19 |
| 發明(設計)人: | 劉明;王明江 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/14;G10L19/038 |
| 代理公司: | 深圳市科吉華烽知識產權事務所(普通合伙)44248 | 代理人: | 陳本發,劉顯揚 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 特征向量 量化 快速 收斂 方法 | ||
技術領域
本發明涉及孤立詞語音識別領域,具體涉及一種語音識別的特征向量量化快速收斂方法。
背景技術
在向量空間中,對大量的向量進行某種特性的統計是很難的,甚至是不現實的。如果用一個編碼來表示具有相似特性的一簇向量,則可以減少數學建模上計算的復雜度以及減少運算時間。這些具有相似特性的向量的集合稱為簇,或聚類。比如,相互之間歐式距離小于某個閾值的向量可以歸類到同一個簇中,或向量的范數小于某個閾值的向量可以歸類到同一個簇中,等等。
在語音識別系統中,語音的特征參數本身就是一個向量,可以按照某種規則將語音特征參數進行分類。語音識別中,一個很關鍵的步驟就是特征參數的量化,以利于減小存儲空間和進行后續的匹配模板的計算。以d維向量為例,我們可以把一個d維向量對應到d維向量空間內的一個點。所有d維向量的集合就構成了坐標空間C。將整個坐標空間C劃分成M個區域,每個區域成為一個聚類,每個聚類用一個符號,例如數字編號來代表,其屬性用該聚類的中心點的一個d維向量表示。
實際上,碼本就是M個聚類形成的集合,建立碼本的過程就是模式分類中的聚類的實現過程。常用的聚類實現的方法都可以用來建立碼本,主要有:LBG聚類算法、模擬退火算法等等。
LBG聚類算法、模擬退火算法實現的語音識別的碼本比較準確,但確定是在實現聚類的過程中,由于要反復迭代計算,迭代次數比較大,因此上述兩種算法的收斂速度都比較慢。如何在不損失碼本精度的前提下,加快聚類算法的收斂速度,快速建立碼本就是一個必須要考慮的問題。
發明內容
為解決現有技術中存在的問題,本發明為大規模孤立詞語音識別提供了一種不損失碼本精確度,但能加快聚類收斂速度,快速建立碼本的方法。本發明通過以下技術方案實現:
一種語音識別的特征向量量化快速收斂方法,其特征在于:所述方法包括以下步驟:
(1)使用LBG算法對語音特征向量進行訓練,產生初始碼本,碼本的個數與訓練用詞庫中詞的個數相同;
(2)從詞庫中隨機選一個詞,將其標識為A,該詞經特征參數提取后,和所有碼本按照下式進行平均量化誤差Di的計算,
其中,T是一個詞的有效語音幀的幀數,是子簇的中心向量;如果詞語B的碼本給出最小的范數,則進行步驟(3),否則進行步驟(4);
(3)對每一個詞的每一幀特征向量Xt,找出其在詞A的簇中的距離它最近的子簇,該子簇的中心向量用表示;找出Xt在詞B的簇中的距離它最近的子簇,該子簇的中心向量用表示,距離分別用DA、DB表示;如果(DA-DB)/DA<δ,則按照下式改變對應子簇的中心向量:
如果(DA-DB)/DA>δ,則按照下式改變對應子簇的中心向量:
其中δ是預先定義的一個閾值,α是一個可變量,α隨著迭代次數的增加而減小;
(4)在該情況下,詞A被正確識別,只需要調整詞A的碼本的子簇的中心向量,對每一幀的幀向量Xt,按照下式進行跳幀
其中,β是一個預先定義的可變量,β隨著迭代次數的增加而遞減;
(5)返回步驟(2),進行迭代,直到(4)=δ或β=0。
進一步地,所述步驟(1)中產生初始碼本的具體步驟為:
首先,將同一個孤立詞由不同的人發音實現的語音信號的特征向量歸類到同一個簇中,這樣對N個詞的語音識別系統,則可以建立N個簇,每個簇中的所有向量繼續歸類成一定數量的子簇,即第i個簇中的子簇個數為Ni。
對第i個簇,隨機地選擇Ni個向量,每個向量初始地代表一個子簇的平均值或中心向量,對第i個簇中剩余的每個特征向量,根據其與各個子簇的中心向量的歐氏距離,將它賦給最近的子簇,該過程中采用LBG算法來實現。
重新計算每個子簇的中心向量的值,將該簇中的每個向量與每個子簇新的中心向量進行歐氏距離計算,把向量賦給最相似的那個子簇,這個過程不斷重復,直到該簇中的所有子簇中心向量的距離的平方和最大,該過程不在LBG算法外進行嵌套迭代,因而加快了收斂速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410281283.1/2.html,轉載請聲明來源鉆瓜專利網。





