[發明專利]一種結合I-vector和PLDA的聲紋識別方法在審
| 申請號: | 202010767770.4 | 申請日: | 2020-08-03 |
| 公開(公告)號: | CN111883143A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 汪禮君 | 申請(專利權)人: | 汪禮君 |
| 主分類號: | G10L17/06 | 分類號: | G10L17/06;G10L17/02;G10L17/08;G10L17/20 |
| 代理公司: | 長沙正務聯合知識產權代理事務所(普通合伙) 43252 | 代理人: | 鄭雋;吳婷 |
| 地址: | 410205 湖南省長沙市高新*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結合 vector plda 聲紋 識別 方法 | ||
1.一種結合I-vector和PLDA的聲紋識別方法,其特征在于,所述方法包括:
獲取待識別聲紋信號,利用譜減法對其進行降噪處理;
對降噪后的待識別聲紋信號進行預加重和加窗處理;
基于聲紋信號能量對待識別聲紋信號進行分幀處理;
利用WS語音特征提取算法提取有效聲紋信號幀中的聲紋信號特征;
根據所提取出的聲紋信號特征,利用I-vector模型提取I-vector特征;
利用PLDA的建模方法,對I-vector特征中的信道信息進行補償;
利用對數似然比方法進行聲紋比對,根據比對結果實現聲紋的識別。
2.如權利要求1所述的一種結合I-vector和PLDA的聲紋識別方法,其特征在于,所述利用譜減法對待識別聲紋信號進行降噪處理,包括:
1)在時域對含噪聲紋信號y(t)、待求解的干凈聲紋信號s(t)以及靜音段的聲紋信號n(t)進行關系表征:
y(t)=s(t)+n(t)
2)分別對上述三種信號進行傅里葉變換,其對應的短時頻譜分別為Y(w),S(w)和N(w),根據語音的特征分布,它們服從均值為0的高斯分布,因此從概率統計學分析可知,它們之間存在如下的平方關系:
|Y(w)|2=|S(w)|2+|N(w)|2+2Re[S(w)N(w)]
3)由于噪聲和語音信號之間是沒有直接關聯的,即噪聲不會隨著語音信號的改變而改變,也就是S(w)和N(w)是相互獨立的,所以Re[S(w)N(w)]=0;
4)S(w)的平方就是語音的功率譜,所以待求解的純凈語音功率譜見下式:
|S(w)|2=|Y(w)|2-|N(w)|2
其中:
Y(w)為含噪聲紋信號的短時頻譜;
N(w)為靜音段聲紋信號的短時頻譜;
S(w)為純凈聲紋信號的短時頻譜。
3.如權利要求2所述的一種結合I-vector和PLDA的聲紋識別方法,其特征在于,所述對待識別聲紋信號進行預加重和加窗處理,包括:
1)利用預加重的函數式提高聲紋信號:
H(z)=1-az-1
其中:
z為待識別的聲紋信號;
a為預加重系數,本發明將其設為0.912;
2)利用漢明窗對所述聲紋信號進行加窗處理,所述漢明窗的時域表達式為:
其中:
n為待識別聲紋信號的幀數;
N為待識別聲紋信號的總幀數。
4.如權利要求3所述的一種結合I-vector和PLDA的聲紋識別方法,其特征在于,所述基于聲紋信號能量的聲紋信號分幀處理過程為:
針對待識別聲紋信號中的若干幀,利用下式計算每一幀的能量:
其中:
x(n)為待識別聲紋信號;
N為待識別聲紋信號的總幀數;
m表示待識別聲紋信號的第m幀;
通過設定不同的能量閾值,依據每一幀的能量將聲紋信號分割成重疊幀,其中能量較高的幀部分即為聲紋信號中的有效部分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于汪禮君,未經汪禮君許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010767770.4/1.html,轉載請聲明來源鉆瓜專利網。





