[發(fā)明專(zhuān)利]一種基于線(xiàn)性回歸的聲紋識(shí)別方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201810141059.0 | 申請(qǐng)日: | 2018-02-11 |
| 公開(kāi)(公告)號(hào): | CN108091326B | 公開(kāi)(公告)日: | 2021-08-06 |
| 發(fā)明(設(shè)計(jì))人: | 張曉雷 | 申請(qǐng)(專(zhuān)利權(quán))人: | 張曉雷 |
| 主分類(lèi)號(hào): | G10L15/02 | 分類(lèi)號(hào): | G10L15/02;G10L15/06;G10L15/08;G10L17/02;G10L17/04;G10L17/22 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 楊華;王寶筠 |
| 地址: | 710072 陜西省西安市友誼西路*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 線(xiàn)性 回歸 聲紋 識(shí)別 方法 系統(tǒng) | ||
本申請(qǐng)?zhí)峁┝艘环N基于線(xiàn)性回歸的聲紋識(shí)別方法及系統(tǒng),從語(yǔ)音數(shù)據(jù)中獲取第一聲紋特征矢量,使用預(yù)先訓(xùn)練的線(xiàn)性回歸模型,將所述第一聲紋特征矢量映射為第二聲紋特征矢量,并對(duì)所述第二聲紋特征矢量進(jìn)行分類(lèi)識(shí)別。創(chuàng)新地將線(xiàn)性回歸模型引入聲紋識(shí)別領(lǐng)域,實(shí)驗(yàn)證明,能夠有效提高聲紋識(shí)別的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及電子信息領(lǐng)域,尤其涉及一種基于線(xiàn)性回歸的聲紋識(shí)別方法及系統(tǒng)。
背景技術(shù)
聲紋識(shí)別系統(tǒng)通常包括聲紋特征提取前端和聲紋識(shí)別后端兩個(gè)部分。
聲紋特征提取前端用于從說(shuō)話(huà)人語(yǔ)句中抽取該說(shuō)話(huà)人的聲紋特征:即通過(guò)模型將一句任意長(zhǎng)度的語(yǔ)音映射為一個(gè)固定長(zhǎng)度的向量。常見(jiàn)的聲紋特征提取前端使用的算法包括:基于高斯混合模型的通用背景模型(Gaussian mixture model based universalbackground model,GMM-UBM)/身份向量(identity vector,i-vector)算法(簡(jiǎn)稱(chēng)GMM/i-vector算法)、基于深度學(xué)習(xí)的語(yǔ)音識(shí)別聲學(xué)模型的通用背景模型/i-vector算法(簡(jiǎn)稱(chēng)DNN/i-vector算法)、以及使用深度學(xué)習(xí)模型對(duì)說(shuō)話(huà)人做分類(lèi),并將最頂層的隱層輸出作為說(shuō)話(huà)人的聲紋向量的d-vector算法。
聲紋識(shí)別后端通過(guò)有監(jiān)督機(jī)器學(xué)習(xí)算法對(duì)該說(shuō)話(huà)人的聲紋矢量做分類(lèi)。它可以分為兩部分,第一個(gè)部分是通過(guò)有監(jiān)督機(jī)器學(xué)習(xí)方法將聲紋特征矢量映射為另一種新的聲紋特征矢量,第二個(gè)部分是通過(guò)有監(jiān)督機(jī)器學(xué)習(xí)方法對(duì)降維后的新聲紋特征矢量做分類(lèi)。對(duì)于第一個(gè)部分,常見(jiàn)的映射方法包括線(xiàn)性鑒別性分析(Linear discriminant analysis,LDA)、類(lèi)內(nèi)方差歸一化(Within-class covariance normalization,WCCN)以及擾動(dòng)屬性投影(Nuisance attribute projection,NAP)等。對(duì)于第二個(gè)部分,常見(jiàn)的分類(lèi)器包括cosine距離分類(lèi)器、支持向量機(jī)(Support vector machine,SVM)分類(lèi)器、概率線(xiàn)性鑒別性分析(Probabilistic linear discriminant analysis,PLDA)分類(lèi)器等。上述后端算法中LDA+PLDA的方法在許多標(biāo)準(zhǔn)化測(cè)試中取得了最優(yōu)性能,目前已被實(shí)際系統(tǒng)廣泛采用。
上述聲紋特征提取前端和聲紋識(shí)別后端可以任意組合形成聲紋識(shí)別系統(tǒng)。但是,目前的聲紋識(shí)別的準(zhǔn)確性還有待提高。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┝艘环N基于線(xiàn)性回歸的聲紋識(shí)別方法及系統(tǒng),目的在于解決如何提高聲紋識(shí)別的準(zhǔn)確性的問(wèn)題。
為了實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┝艘韵录夹g(shù)方案:
一種基于線(xiàn)性回歸的聲紋識(shí)別方法,包括:
從語(yǔ)音數(shù)據(jù)中獲取第一聲紋特征矢量;
使用預(yù)先訓(xùn)練的線(xiàn)性回歸模型,將所述第一聲紋特征矢量映射為第二聲紋特征矢量;
對(duì)所述第二聲紋特征矢量進(jìn)行分類(lèi)識(shí)別。
可選的,所述將所述第一聲紋特征矢量映射為第二聲紋特征矢量包括:
使用映射關(guān)系z(mì)=ATx,將所述第一聲紋特征矢量映射為第二聲紋特征矢量,其中,A為所述預(yù)先訓(xùn)練的線(xiàn)性回歸模型,x為所述第一聲紋特征矢量,z為所述第二聲紋特征矢量。
可選的,所述線(xiàn)性回歸模型的訓(xùn)練過(guò)程包括:
從聲紋數(shù)據(jù)庫(kù)中獲取訓(xùn)練數(shù)據(jù)其中,xi,j為從所述聲紋數(shù)據(jù)庫(kù)中的每句話(huà)抽取的一個(gè)d維的聲紋特征矢量,i=1,…,n,j=1,…,Mi,n為所述聲紋數(shù)據(jù)庫(kù)中的說(shuō)話(huà)人的數(shù)量,任意一個(gè)說(shuō)話(huà)人對(duì)應(yīng)Mn句話(huà);yi,j為第i個(gè)說(shuō)話(huà)人的n維示性矢量yi,j=[0,...,1,...,0]T;d為預(yù)設(shè)數(shù)值;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于張曉雷,未經(jīng)張曉雷許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810141059.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 非線(xiàn)性項(xiàng)的選擇裝置及方法、辨識(shí)系統(tǒng)及補(bǔ)償系統(tǒng)
- 線(xiàn)性光源及其包含該線(xiàn)性光源的線(xiàn)性同軸光源
- 一種適用于不確定性系統(tǒng)的非線(xiàn)性度量方法
- 數(shù)字調(diào)制器非線(xiàn)性校正
- 數(shù)控加工設(shè)備
- 一種雙工位機(jī)械手快速上下料裝置
- 線(xiàn)性馬達(dá)、線(xiàn)性馬達(dá)驅(qū)動(dòng)裝置及線(xiàn)性馬達(dá)冷卻方法
- 高音線(xiàn)性號(hào)角及線(xiàn)性音箱
- 一種面向復(fù)雜工業(yè)過(guò)程難測(cè)參數(shù)的軟測(cè)量方法
- 線(xiàn)性燈外殼及線(xiàn)性燈
- 基于KNN的置信回歸算法及裝置
- 自動(dòng)行走設(shè)備的路徑回歸方法、自動(dòng)行走設(shè)備及路徑回歸系統(tǒng)
- 一種基于特征選擇和集成學(xué)習(xí)的軟件缺陷個(gè)數(shù)預(yù)測(cè)方法
- 一種基于集成正交成分最優(yōu)化回歸分析的軟測(cè)量方法
- 廣告場(chǎng)景的回歸測(cè)試方法、裝置及系統(tǒng)
- 回歸測(cè)試方法及裝置
- 正則化線(xiàn)性回歸生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種精確預(yù)測(cè)隧道圍巖位移的方法
- 多環(huán)境協(xié)同回歸方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)
- 回歸測(cè)試方法及裝置
- 一種快速識(shí)別聲紋方法和系統(tǒng)
- 聲紋遙控器
- 一種自學(xué)習(xí)聲紋識(shí)別的更新方法和裝置
- 基于聲紋信息的身份認(rèn)證及識(shí)別方法
- 一種聲紋數(shù)據(jù)庫(kù)建立方法、聲紋識(shí)別方法、裝置及系統(tǒng)
- 聲紋信息的比對(duì)方法及裝置、儲(chǔ)存介質(zhì)、電子裝置
- 聲紋認(rèn)證方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種處理方法及電子設(shè)備
- 聲紋相似度智能識(shí)別系統(tǒng)、方法及存儲(chǔ)介質(zhì)
- 碰撞檢測(cè)方法、機(jī)器人、移動(dòng)終端及存儲(chǔ)介質(zhì)





