[發(fā)明專利]一種基于DTW的孤立詞語(yǔ)音識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710264774.9 | 申請(qǐng)日: | 2017-04-21 |
| 公開(kāi)(公告)號(hào): | CN107039037A | 公開(kāi)(公告)日: | 2017-08-11 |
| 發(fā)明(設(shè)計(jì))人: | 鄧立新;周炳良;洪民江 | 申請(qǐng)(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號(hào): | G10L15/12 | 分類號(hào): | G10L15/12;G10L15/06;G10L15/02 |
| 代理公司: | 江蘇愛(ài)信律師事務(wù)所32241 | 代理人: | 趙贊贊 |
| 地址: | 210003 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 dtw 孤立 詞語(yǔ) 識(shí)別 方法 | ||
1.一種基于DTW的孤立詞語(yǔ)音識(shí)別方法,基于傳統(tǒng)的語(yǔ)音訓(xùn)練模式,改進(jìn)了語(yǔ)音識(shí)別階段,其特征在于,先截取測(cè)試語(yǔ)音特征矢量的起始部分長(zhǎng)度,并從起點(diǎn)開(kāi)始搜索它們與各個(gè)模板矢量的最優(yōu)匹配路徑,采用松弛端點(diǎn)檢測(cè)的方法找到最優(yōu)匹配路徑的止點(diǎn)并求出各自的最小累積距離D,即找出各模板矢量與截取語(yǔ)音特征矢量匹配度最大的起始部分長(zhǎng)度并求出相應(yīng)的D,然后選擇D相對(duì)較小的部分模板保留下來(lái),排除掉D相對(duì)較大的模板;如此循環(huán)采用這種方法對(duì)剩余的模板進(jìn)行部分長(zhǎng)度匹配和排除,直至剩余模板數(shù)量唯一。
2.如權(quán)要求1所述的方法,其特征在于,識(shí)別階段具體步驟如下:
步驟1:將通過(guò)訓(xùn)練得到語(yǔ)音訓(xùn)練模板存入內(nèi)存,總數(shù)記為c,同時(shí)進(jìn)行識(shí)別階段預(yù)設(shè)工作,設(shè)置測(cè)試語(yǔ)音特征矢量的截取方式,包括截取次數(shù)m和各次截取長(zhǎng)度a1,a2…am即百分比;設(shè)置各次最優(yōu)路徑匹配后訓(xùn)練模板的保留個(gè)數(shù)b1,b2…bm-1,百分比且最后一次取一個(gè)模板,bm可忽略;
步驟2:利用測(cè)試語(yǔ)音特征矢量與訓(xùn)練模板矢量最優(yōu)匹配路徑的全局限制條件,排除部分訓(xùn)練模板,保留滿足條件的訓(xùn)練模板;條件公式如下:
其中N為測(cè)試語(yǔ)音特征矢量長(zhǎng)度,M為訓(xùn)練模板矢量長(zhǎng)度;
步驟3:記保存測(cè)試語(yǔ)音特征矢量與某一保留訓(xùn)練模板矢量幀匹配失真度矩陣為d和累積失真度矩陣為D=Realmax,其中d和D的大小均為N*M且橫向表示測(cè)試語(yǔ)音幀,縱向表示訓(xùn)練模板幀。計(jì)算測(cè)試語(yǔ)音特征矢量第一幀與上述訓(xùn)練模板矢量第一幀的幀失真度,并保存到d(1,1)和D(1,1)中;同理,計(jì)算測(cè)試語(yǔ)音特征矢量第一幀與所有保留訓(xùn)練模板矢量第一幀的幀失真度,并分別保存到各自的幀失真度矩陣d與累積失真度矩陣D相同的位置;
步驟4:滿足圖4全局路徑限制,搜索出訓(xùn)練模板矢量中與測(cè)試語(yǔ)音特征矢量第s-f幀相交的幀,其中四舍五入取整,n為截取迭代次數(shù),初值n=1且a0=0;
步驟5:計(jì)算搜索到的相交幀的幀失真度,并利用如下公式遞推相交幀的累積失真度,分別保存到d與D相應(yīng)的位置,其中累積失真度公式滿足圖5的局部路徑限制方式;累積失真度公式:
D(x,y)=d(T(x),R(y))+min{D(x-1,y),D(x-1,y-1),D(x-1,y-2)}
其中T(x)為測(cè)試語(yǔ)音特征矢量第x幀,R(y)為訓(xùn)練模板矢量第y幀;
步驟6:搜索累積失真度矩陣f列中最小的值,記為該訓(xùn)練模板矢量與測(cè)試語(yǔ)音特征矢量部分匹配失真度Dmin;
步驟7:利用步驟4~6,計(jì)算并搜索出測(cè)試語(yǔ)音特征矢量與所有保留訓(xùn)練模板矢量的部分匹配失真度Dmin。將所有訓(xùn)練模板矢量按照得到的Dmin進(jìn)行從小到大排序,保留排序前c*bn個(gè)模板,,四舍五入取整;
步驟8:判決c*bn>1?
若是,則轉(zhuǎn)入步驟9執(zhí)行;
若否,則轉(zhuǎn)入步驟10執(zhí)行;
步驟9:檢測(cè)n<m?
若是,則截取迭代次數(shù)n=n+1,轉(zhuǎn)入步驟4執(zhí)行;
若否,則轉(zhuǎn)入步驟10執(zhí)行;
步驟10:將步驟7中已排序的訓(xùn)練模板矢量中的第一個(gè)訓(xùn)練模板矢量表示的語(yǔ)音判決為測(cè)試語(yǔ)音,結(jié)束。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710264774.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于DTW曲線的運(yùn)動(dòng)數(shù)據(jù)動(dòng)作分類方法
- 基于DTW與HMM證據(jù)融合的特種車?guó)Q笛聲識(shí)別方法
- 一種基于GPU的旋律匹配并行化方法
- 一種基于DTW的時(shí)間序列相似性預(yù)測(cè)方法
- 一種自動(dòng)快速識(shí)別地質(zhì)構(gòu)造的DTW地震體屬性分析方法
- 一種電網(wǎng)差動(dòng)保護(hù)的計(jì)算方法
- 一種基于DBA-DTW-KNN的機(jī)械通氣人機(jī)不同步快速識(shí)別方法
- 道岔轉(zhuǎn)轍機(jī)故障識(shí)別方法及裝置
- 一種基于DTW-DBSCAN算法的空中目標(biāo)分群方法
- 基于DTW和GMM的短詞句語(yǔ)音識(shí)別方法及系統(tǒng)
- 修正掩模圖案的方法、光掩模和半導(dǎo)體器件及其制造方法
- 圖像處理裝置以及圖像處理程序
- 一種本區(qū)和鄰區(qū)的路損上報(bào)方法及設(shè)備
- 無(wú)線網(wǎng)絡(luò)配置方法、裝置和系統(tǒng)
- 用于孤立負(fù)載物品的設(shè)備
- 一種基于設(shè)計(jì)模型匹配孤立點(diǎn)識(shí)別與刪除方法及系統(tǒng)
- 喀斯特地貌下孤立山峰上空風(fēng)場(chǎng)模擬范圍選取方法
- 一種面向Wi-Fi信號(hào)的手語(yǔ)孤立詞識(shí)別網(wǎng)絡(luò)構(gòu)建及分類方法
- 一種針對(duì)下降型海洋內(nèi)孤立波的振幅反演方法及裝置
- 孤立圖形設(shè)計(jì)方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備





