[發明專利]一種聲紋特征識別方法及系統在審
| 申請號: | 201611075677.7 | 申請日: | 2016-11-29 |
| 公開(公告)號: | CN106782565A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 徐曉東;張程;張毅 | 申請(專利權)人: | 重慶重智機器人研究院有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/26 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙)11371 | 代理人: | 唐維虎 |
| 地址: | 400000 重慶市*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲紋 特征 識別 方法 系統 | ||
1.一種聲紋特征識別方法,其特征在于,該方法包括:
對輸入的原始語音信號進行預處理,所述預處理包括預加重、分幀加窗以及端點檢測;
對預處理后得到的含噪混合信號進行基于聽覺特性的語音分離處理;
提取經語音分離處理后的信號的頻率倒譜系數和感知線性預測系數;
利用噪聲背景區分度,在不同噪聲環境下對頻率倒譜系數和感知線性預測系數進行分析以完成特征融合;
在預先建立的聲紋特征模板庫中,采用高斯混合模型-通用背景模型對已完成融合的特征進行模式匹配,實現聲紋特征識別。
2.根據權利要求1所述的聲紋特征識別方法,其特征在于,對預處理后得到的含噪混合信號進行基于聽覺特性的語音分離處理的步驟包括:
將所述含噪混合信號進行分解,得到多個時頻單元;
依據語音分離線索對分解得到的所述多個時頻單元進行聚類;
對聚類后的待合成信號進行語音重構,輸出分離后的語音。
3.根據權利要求2所述的聲紋特征識別方法,其特征在于,所述語音分離線索包括兩耳時差和兩耳聲級差。
4.根據權利要求2或3所述的聲紋特征識別方法,其特征在于,依據語音分離線索對分解得到的所述多個時頻單元進行聚類的步驟包括:
依據掩蔽模型對所述多個時頻單元進行二值掩碼聚類,其中,fi表示第i頻率通道的頻率,fc表示高頻與中低頻間的臨界頻率,τ(i,j)表示第i頻率通道與第j時間幀的一個分離線索,L(i,j)表示第i頻率通道與第j時間幀的另一個分離線索,Tτ(i,j)和Tl(i,j)分別表示兩個分離線索的閾值。
5.根據權利要求2所述的聲紋特征識別方法,其特征在于,對聚類后的待合成信號進行語音重構的步驟包括:
對所述待合成信號進行韻律調整,所述韻律包括幅度、長度和基音;
依據重構公式:對經韻律調整后的信號進行語音重構,其中,tj表示重構的同步標志,hj(n)表示窗函數,表示短時語音信號,gj表示幅度調整的權值。
6.根據權利要求1所述的聲紋特征識別方法,其特征在于,提取經語音分離處理后的信號的頻率倒譜系數和感知線性預測系數的步驟包括:
基于Gammatone濾波器組提取所述經語音分離處理后的信號的頻率倒譜系數。
7.一種聲紋特征識別系統,其特征在于,該系統包括:
預處理模塊,用于對輸入的原始語音信號進行預處理,所述預處理包括預加重、分幀加窗以及端點檢測;
語音分離模塊,用于對預處理后得到的含噪混合信號進行基于聽覺特性的語音分離處理;
特征提取模塊,用于提取經語音分離處理后的信號的頻率倒譜系數和感知線性預測系數;
特征融合模塊,用于利用噪聲背景區分度,在不同噪聲環境下對頻率倒譜系數和感知線性預測系數進行分析以完成特征融合;
特征識別模塊,用于在預先建立的聲紋特征模板庫中,采用高斯混合模型-通用背景模型對已完成融合的特征進行模式匹配,實現聲紋特征識別。
8.根據權利要求7所述的聲紋特征識別系統,其特征在于,所述語音分離模塊對預處理后得到的含噪混合信號進行基于聽覺特性的語音分離處理的方式包括:
將所述含噪混合信號進行分解,得到多個時頻單元;
依據語音分離線索對分解得到的所述多個時頻單元進行聚類;
對聚類后的待合成信號進行語音重構,輸出分離后的語音。
9.根據權利要求8所述的聲紋特征識別系統,其特征在于,所述語音分離模塊依據語音分離線索對分解得到的所述多個時頻單元進行聚類的方式包括:
依據掩蔽模型對所述多個時頻單元進行二值掩碼聚類,其中,fi表示第i頻率通道的頻率,fc表示高頻與中低頻間的臨界頻率,τ(i,j)表示第i頻率通道與第j時間幀的一個分離線索,L(i,j)表示第i頻率通道與第j時間幀的另一個分離線索,Tτ(i,j)和Tl(i,j)分別表示兩個分離線索的閾值。
10.根據權利要求7所述的聲紋特征識別系統,其特征在于,所述特征提取模塊提取經語音分離處理后的信號的頻率倒譜系數和感知線性預測系數的方式包括:
基于Gammatone濾波器組提取所述經語音分離處理后的信號的頻率倒譜系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶重智機器人研究院有限公司,未經重慶重智機器人研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611075677.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于處理語音數據的方法和裝置
- 下一篇:收集個人聲音特征的方法





