[發(fā)明專利]一種語音識別的特征向量量化快速收斂方法有效
| 申請?zhí)枺?/td> | 201410281283.1 | 申請日: | 2014-06-20 |
| 公開(公告)號: | CN104064181B | 公開(公告)日: | 2017-04-19 |
| 發(fā)明(設(shè)計(jì))人: | 劉明;王明江 | 申請(專利權(quán))人: | 哈爾濱工業(yè)大學(xué)深圳研究生院 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/14;G10L19/038 |
| 代理公司: | 深圳市科吉華烽知識產(chǎn)權(quán)事務(wù)所(普通合伙)44248 | 代理人: | 陳本發(fā),劉顯揚(yáng) |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 識別 特征向量 量化 快速 收斂 方法 | ||
1.一種語音識別的特征向量量化快速收斂方法,其特征在于:所述方法包括以下步驟:
(1)使用LBG算法對語音特征向量進(jìn)行訓(xùn)練,產(chǎn)生初始碼本,碼本的個數(shù)與訓(xùn)練用詞庫中詞的個數(shù)相同;
(2)從詞庫中隨機(jī)選一個詞,將其標(biāo)識為A,該詞經(jīng)特征參數(shù)提取后,和所有碼本按照下式進(jìn)行平均量化誤差Di的計(jì)算,
其中,T是一個詞的有效語音幀的幀數(shù),是子簇的中心向量;如果詞語B的碼本給出最小的范數(shù),則進(jìn)行步驟(3),否則進(jìn)行步驟(4);
(3)對每一個詞的每一幀特征向量Xt,找出其在詞A的簇中的距離它最近的子簇,該子簇的中心向量用表示;找出Xt在詞B的簇中的距離它最近的子簇,該子簇的中心向量用表示,距離分別用DA、DB表示;如果(DA-DB)/DA<δ,則按照下式改變對應(yīng)子簇的中心向量:
如果(DA-DB)/DA>δ,則按照下式改變對應(yīng)子簇的中心向量:
其中δ是預(yù)先定義的一個閾值,α是一個可變量,α隨著迭代次數(shù)的增加而減小;
(4)在該情況下,詞A被正確識別,只需要調(diào)整詞A的碼本的子簇的中心向量,對每一幀的幀向量Xt,按照下式進(jìn)行跳幀
其中,β是一個預(yù)先定義的可變量,β隨著迭代次數(shù)的增加而遞減;
(5)返回步驟(2),進(jìn)行迭代,直到α=0或β=0。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué)深圳研究生院,未經(jīng)哈爾濱工業(yè)大學(xué)深圳研究生院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410281283.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





