[發(fā)明專(zhuān)利]一種基于獨(dú)立向量分析的語(yǔ)音特征融合的說(shuō)話人識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110972388.1 | 申請(qǐng)日: | 2021-08-24 |
| 公開(kāi)(公告)號(hào): | CN113793614A | 公開(kāi)(公告)日: | 2021-12-14 |
| 發(fā)明(設(shè)計(jì))人: | 張燁;馬彪 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南昌大學(xué) |
| 主分類(lèi)號(hào): | G10L17/02 | 分類(lèi)號(hào): | G10L17/02;G10L17/06;G10L25/45;G10L25/24;G10L25/03 |
| 代理公司: | 北京眾合誠(chéng)成知識(shí)產(chǎn)權(quán)代理有限公司 11246 | 代理人: | 王煥巧 |
| 地址: | 330000 江西省*** | 國(guó)省代碼: | 江西;36 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 獨(dú)立 向量 分析 語(yǔ)音 特征 融合 說(shuō)話 識(shí)別 方法 | ||
1.一種基于獨(dú)立向量分析的語(yǔ)音特征融合的說(shuō)話人識(shí)別方法,其特征在于:首先將語(yǔ)音信號(hào)的時(shí)域特征和頻域特征分別構(gòu)成時(shí)域特征矩陣和頻域特征矩陣;然后,將時(shí)域特征矩陣和頻域特征矩陣構(gòu)成一個(gè)特征張量;最后,利用獨(dú)立向量分析,從此特征張量中提取融合特征,建立說(shuō)話人模型,實(shí)現(xiàn)說(shuō)話人的識(shí)別。
2.根據(jù)權(quán)利要求1所述的基于獨(dú)立向量分析的語(yǔ)音特征融合的說(shuō)話人識(shí)別方法,語(yǔ)音特征融合過(guò)程按如下步驟:
①利用漢明窗將說(shuō)話人的語(yǔ)音信號(hào)分幀,提取每一幀的時(shí)域特征向量和頻域特征向量,將提取出的特征向量分別構(gòu)成K個(gè)特征矩陣,即其中,x[k](t)表示第k個(gè)特征類(lèi)型的第t幀的特征向量,N表示特征的維數(shù),T表示語(yǔ)音幀的個(gè)數(shù);
②將K個(gè)特征矩陣X[k]并聯(lián)成一個(gè)張量是一種沒(méi)有使用獨(dú)立向量分析的融合特征,為了和提出的融合特征相區(qū)別,被記為特征張量;對(duì)此特征張量采用獨(dú)立向量分析建立說(shuō)話人的模型,提取獨(dú)立向量,即
其中,為融合特征,其中為獨(dú)立向量的估計(jì);是由K個(gè)解混矩陣并聯(lián)構(gòu)成的解混張量作為說(shuō)話人的模型;
③利用優(yōu)化函數(shù)來(lái)估計(jì)獨(dú)立向量和解混張量,即:
上式中,H[·]表示信息熵,det(·)表示行列式,為獨(dú)立向量的估計(jì),n∈{1,...,N},C=H[x[1](t),...,x[K](t)]是一個(gè)常數(shù);
采用牛頓算法同時(shí)更新K個(gè)解混矩陣的第n行表示第k個(gè)解混矩陣的第n行,n∈{1,...,N},即
其中,μ為學(xué)習(xí)率,表示損失函數(shù)對(duì)wn的導(dǎo)數(shù),為Hessian矩陣。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南昌大學(xué),未經(jīng)南昌大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110972388.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類(lèi)別向量的方法和裝置





