[發(fā)明專(zhuān)利]i-vector向量提取方法、說(shuō)話人識(shí)別方法、裝置、設(shè)備及介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201810574010.4 | 申請(qǐng)日: | 2018-06-06 |
| 公開(kāi)(公告)號(hào): | CN109065022B | 公開(kāi)(公告)日: | 2022-08-09 |
| 發(fā)明(設(shè)計(jì))人: | 涂宏 | 申請(qǐng)(專(zhuān)利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G10L15/02 | 分類(lèi)號(hào): | G10L15/02;G10L15/06;G10L25/51 |
| 代理公司: | 深圳眾鼎專(zhuān)利商標(biāo)代理事務(wù)所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | vector 向量 提取 方法 說(shuō)話 識(shí)別 裝置 設(shè)備 介質(zhì) | ||
1.一種i-vector向量提取方法,其特征在于,包括:
獲取說(shuō)話人的訓(xùn)練語(yǔ)音數(shù)據(jù),并提取所述訓(xùn)練語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練語(yǔ)音特征;
基于預(yù)設(shè)UBM模型訓(xùn)練出與預(yù)設(shè)UBM模型對(duì)應(yīng)的總體變化子空間;
將所述訓(xùn)練語(yǔ)音特征投影在所述總體變化子空間上,獲取第一i-vector向量;
將所述第一i-vector向量投影在所述總體變化子空間上,獲取與所述說(shuō)話人對(duì)應(yīng)的注冊(cè)i-vector向量。
2.如權(quán)利要求1所述的i-vector向量提取方法,其特征在于,所述提取所述訓(xùn)練語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練語(yǔ)音特征,包括:
對(duì)所述訓(xùn)練語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理,獲取預(yù)處理語(yǔ)音數(shù)據(jù);
對(duì)所述預(yù)處理語(yǔ)音數(shù)據(jù)作快速傅里葉變換,獲取訓(xùn)練語(yǔ)音數(shù)據(jù)的頻譜,并根據(jù)所述頻譜獲取訓(xùn)練語(yǔ)音數(shù)據(jù)的功率譜;
采用梅爾刻度濾波器組處理所述訓(xùn)練語(yǔ)音數(shù)據(jù)的功率譜,獲取訓(xùn)練語(yǔ)音數(shù)據(jù)的梅爾功率譜;
在所述梅爾功率譜上進(jìn)行倒譜分析,獲取訓(xùn)練語(yǔ)音數(shù)據(jù)的MFCC特征。
3.如權(quán)利要求1所述的i-vector向量提取方法,其特征在于,所述基于預(yù)設(shè)UBM模型訓(xùn)練出與預(yù)設(shè)UBM模型對(duì)應(yīng)的總體變化子空間,包括:
獲取所述預(yù)設(shè)UBM模型的高維充分統(tǒng)計(jì)量;
采用最大期望算法對(duì)所述高維充分統(tǒng)計(jì)量進(jìn)行迭代,獲取對(duì)應(yīng)的總體變化子空間。
4.如權(quán)利要求1所述的i-vector向量提取方法,其特征在于,所述將所述訓(xùn)練語(yǔ)音特征投影在所述總體變化子空間上,獲取第一i-vector向量,包括:
基于所述訓(xùn)練語(yǔ)音特征和所述預(yù)設(shè)UBM模型,采用均值MAP自適應(yīng)方法獲取GMM-UBM模型;
采用公式s1=m+Tw1將所述訓(xùn)練語(yǔ)音特征投影在所述總體變化子空間上,獲取第一i-vector向量,其中,s1是C*F維的GMM-UBM模型中與所述訓(xùn)練語(yǔ)音特征相對(duì)應(yīng)的均值超矢量;m是與說(shuō)話人無(wú)關(guān)且信道無(wú)關(guān)的C*F維超向量;T是所述總體變化子空間,維度為CF*N;w1是第一i-vector向量,維度為N。
5.如權(quán)利要求1所述的i-vector向量提取方法,其特征在于,所述將所述第一i-vector向量投影在所述總體變化子空間上,獲取與所述說(shuō)話人對(duì)應(yīng)的注冊(cè)i-vector向量,包括:
采用公式s2=m+Tw2將所述第一i-vector向量投影在所述總體變化子空間上,獲取注冊(cè)i-vector向量,其中,s2是D*G維的與所述注冊(cè)i-vector向量相對(duì)應(yīng)的均值超矢量;m是與說(shuō)話人無(wú)關(guān)且信道無(wú)關(guān)的D*G維超向量;T是所述總體變化子空間,維度為DG*M;w2是注冊(cè)i-vector向量,維度為M。
6.一種說(shuō)話人識(shí)別方法,其特征在于,包括:
獲取測(cè)試語(yǔ)音數(shù)據(jù),所述測(cè)試語(yǔ)音數(shù)據(jù)攜帶說(shuō)話人標(biāo)識(shí);
還包括采用權(quán)利要求1-5任一項(xiàng)所述i-vector向量提取方法對(duì)所述測(cè)試語(yǔ)音數(shù)據(jù)進(jìn)行處理,獲取對(duì)應(yīng)的測(cè)試i-vector向量;
基于所述說(shuō)話人標(biāo)識(shí)查詢(xún)數(shù)據(jù)庫(kù),獲取與所述說(shuō)話人標(biāo)識(shí)對(duì)應(yīng)的注冊(cè)i-vector向量;
采用余弦相似度算法獲取所述測(cè)試i-vector向量和所述注冊(cè)i-vector向量的相似度,根據(jù)所述相似度檢測(cè)所述測(cè)試i-vector向量和所述注冊(cè)i-vector是否對(duì)應(yīng)同一說(shuō)話人。
7.一種i-vector向量提取裝置,其特征在于,包括:
獲取語(yǔ)音數(shù)據(jù)模塊,用于獲取說(shuō)話人的訓(xùn)練語(yǔ)音數(shù)據(jù),并提取所述訓(xùn)練語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練語(yǔ)音特征;
訓(xùn)練變化空間模塊,用于基于預(yù)設(shè)UBM模型訓(xùn)練出與預(yù)設(shè)UBM模型對(duì)應(yīng)的總體變化子空間;
投影變化空間模塊,用于將所述訓(xùn)練語(yǔ)音特征投影在所述總體變化子空間上,獲取第一i-vector向量;
獲取i-vector向量模塊,用于將所述第一i-vector向量投影在所述總體變化子空間上,獲取與所述說(shuō)話人對(duì)應(yīng)的注冊(cè)i-vector向量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810574010.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:基于條件深度卷積生成對(duì)抗網(wǎng)絡(luò)的端到端方言辨識(shí)方法
- 下一篇:一種語(yǔ)音鑒定方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 分布式計(jì)算方法和裝置
- 語(yǔ)音數(shù)據(jù)處理方法和裝置
- 一種聲紋識(shí)別方法及系統(tǒng)
- 一種針對(duì)短語(yǔ)音的說(shuō)話人識(shí)別模型的訓(xùn)練方法及裝置
- i-vector向量提取方法、說(shuō)話人識(shí)別方法、裝置、設(shè)備及介質(zhì)
- 一種性別年齡識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種基于降噪自動(dòng)編碼器的語(yǔ)種識(shí)別分類(lèi)方法及裝置
- 一種聲紋特征的融合方法及裝置
- 身份矢量x-vector線性變換下的說(shuō)話人識(shí)別方法
- 一種聲紋聚類(lèi)方法、裝置、處理設(shè)備以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類(lèi)別向量的方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





