[發明專利]i-vector向量提取方法、說話人識別方法、裝置、設備及介質有效
| 申請號: | 201810574010.4 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN109065022B | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 涂宏 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L25/51 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | vector 向量 提取 方法 說話 識別 裝置 設備 介質 | ||
1.一種i-vector向量提取方法,其特征在于,包括:
獲取說話人的訓練語音數據,并提取所述訓練語音數據對應的訓練語音特征;
基于預設UBM模型訓練出與預設UBM模型對應的總體變化子空間;
將所述訓練語音特征投影在所述總體變化子空間上,獲取第一i-vector向量;
將所述第一i-vector向量投影在所述總體變化子空間上,獲取與所述說話人對應的注冊i-vector向量。
2.如權利要求1所述的i-vector向量提取方法,其特征在于,所述提取所述訓練語音數據對應的訓練語音特征,包括:
對所述訓練語音數據進行預處理,獲取預處理語音數據;
對所述預處理語音數據作快速傅里葉變換,獲取訓練語音數據的頻譜,并根據所述頻譜獲取訓練語音數據的功率譜;
采用梅爾刻度濾波器組處理所述訓練語音數據的功率譜,獲取訓練語音數據的梅爾功率譜;
在所述梅爾功率譜上進行倒譜分析,獲取訓練語音數據的MFCC特征。
3.如權利要求1所述的i-vector向量提取方法,其特征在于,所述基于預設UBM模型訓練出與預設UBM模型對應的總體變化子空間,包括:
獲取所述預設UBM模型的高維充分統計量;
采用最大期望算法對所述高維充分統計量進行迭代,獲取對應的總體變化子空間。
4.如權利要求1所述的i-vector向量提取方法,其特征在于,所述將所述訓練語音特征投影在所述總體變化子空間上,獲取第一i-vector向量,包括:
基于所述訓練語音特征和所述預設UBM模型,采用均值MAP自適應方法獲取GMM-UBM模型;
采用公式s1=m+Tw1將所述訓練語音特征投影在所述總體變化子空間上,獲取第一i-vector向量,其中,s1是C*F維的GMM-UBM模型中與所述訓練語音特征相對應的均值超矢量;m是與說話人無關且信道無關的C*F維超向量;T是所述總體變化子空間,維度為CF*N;w1是第一i-vector向量,維度為N。
5.如權利要求1所述的i-vector向量提取方法,其特征在于,所述將所述第一i-vector向量投影在所述總體變化子空間上,獲取與所述說話人對應的注冊i-vector向量,包括:
采用公式s2=m+Tw2將所述第一i-vector向量投影在所述總體變化子空間上,獲取注冊i-vector向量,其中,s2是D*G維的與所述注冊i-vector向量相對應的均值超矢量;m是與說話人無關且信道無關的D*G維超向量;T是所述總體變化子空間,維度為DG*M;w2是注冊i-vector向量,維度為M。
6.一種說話人識別方法,其特征在于,包括:
獲取測試語音數據,所述測試語音數據攜帶說話人標識;
還包括采用權利要求1-5任一項所述i-vector向量提取方法對所述測試語音數據進行處理,獲取對應的測試i-vector向量;
基于所述說話人標識查詢數據庫,獲取與所述說話人標識對應的注冊i-vector向量;
采用余弦相似度算法獲取所述測試i-vector向量和所述注冊i-vector向量的相似度,根據所述相似度檢測所述測試i-vector向量和所述注冊i-vector是否對應同一說話人。
7.一種i-vector向量提取裝置,其特征在于,包括:
獲取語音數據模塊,用于獲取說話人的訓練語音數據,并提取所述訓練語音數據對應的訓練語音特征;
訓練變化空間模塊,用于基于預設UBM模型訓練出與預設UBM模型對應的總體變化子空間;
投影變化空間模塊,用于將所述訓練語音特征投影在所述總體變化子空間上,獲取第一i-vector向量;
獲取i-vector向量模塊,用于將所述第一i-vector向量投影在所述總體變化子空間上,獲取與所述說話人對應的注冊i-vector向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810574010.4/1.html,轉載請聲明來源鉆瓜專利網。





