[發明專利]一種應對復雜聲學環境的說話人確認方法、系統及存儲介質在審
| 申請號: | 202010871239.1 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN111986679A | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 劉明;周彥兵;孫沖武;趙學華;高波 | 申請(專利權)人: | 深圳信息職業技術學院 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L21/0208;G10L25/12;G10L25/24;G10L25/30;G10L25/45 |
| 代理公司: | 深圳市添源知識產權代理事務所(普通合伙) 44451 | 代理人: | 黎健任 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應對 復雜 聲學環境 說話 確認 方法 系統 存儲 介質 | ||
1.一種應對復雜聲學環境的說話人確認方法,其特征在于,包括執行以下步驟:
步驟1:輸入說話人音頻;
步驟2:接收步驟1的說話人音頻,再采用梅爾倒譜系數提取模塊和線性預測提取模塊提取出所接收的說話人音頻中的人工聲紋特征,最后將提取的人工聲紋特征送到特征增強模塊;
步驟3:采用特征增強模塊接收步驟2提取的人工聲紋特征,并通過特征增強模塊對所接收的人工聲紋特征進行降噪處理,得到增強后的人工聲紋特征,最后將增強后的人工聲紋特征送到聲紋識別模塊;
步驟4:采用聲紋識別模塊接收增強后的人工聲紋特征,進行更深層次的抽象表示分析,再在神經網絡的輸出層得到新的特征表示形式,最后計算不同語句之間的相似值,輸出相似度向量,并做出是否是目標說話人的判決。
2.根據權利要求1所述的說話人確認方法,其特征在于,在所述步驟2中,所述梅爾倒譜系數提取模塊還包括依次執行以下步驟:
預處理步驟:將原始語音信號進行采樣量化、預加重、加窗分幀預處理,得到每一幀語音信號的語音序列s(n);
傅里葉變換步驟:對預處理后得到的語音序列s(n)進行快速傅里葉變換,將其從時域變換到頻域,得到其頻譜,并求得頻譜的幅度值S(k);
濾波步驟:將幅度值S(k)通過梅爾頻率濾波器組Hm(k)得到的輸出為Pm(m=0,1,…,M-1),參數Pm的表達公式如下:
其中,Hm(k)是梅爾頻率濾波器組的傳遞函數,其定義表達如下式所示:
公式(2)中M為三角形濾波器的數量,即梅爾濾波器組的階數,f(m)是三角形濾波器的中心頻率;f(m-1)和f(m+1)分別表示一個三角形濾波器的上限頻率與下限頻率;
梅爾倒譜系數計算步驟:對參數Pm進行對數能量計算,輸出得到的參數為Lm(m=0,1,…,M-1),再將參數Lm進行離散余弦變換,將得到的參數Lm轉換到倒譜域中,這樣就得到了梅爾倒譜系數Cmel,其具體過程如下:
Lm=ln(Pm),(m=0,1,…,M-1) (3)
上式(4)中的Cmel(k)就是所需要求取的MFCC特征參數,N表示梅爾倒譜系數的階數,這里我們取N=40,也就是提取40維的MFCC特征。
3.根據權利要求1所述的說話人確認方法,其特征在于,在所述步驟2中,所述線性預測提取模塊還包括依次執行以下步驟:
步驟S1:對輸入的語音信號進行預加重、分幀加窗和濾波的預處理;
步驟S2:為了求解線性預測系數,令并寫出自相關函數的形式如下:
其中R(j)是自相關函數,拆寫加權式子,便得到如下的Toeplize矩陣表達形式:
步驟S3:使用Durbin算法來求解Toeplize矩陣,即可計算出濾波器系數ai,也就是線性預測系數,進而求得線性預測系數的殘差值e(n),取p=38,也就是提取38維的線性預測系數;
步驟S4:對殘差信號e(n)進行快速傅里葉變換,使其從時域變換到頻域,得到其頻譜,將殘差頻譜的一階矩、二階矩也作為特征參數,與提取的38維線性預測系數一起組成該模塊的40維線性預測特征。
4.根據權利要求1所述的說話人確認方法,其特征在于,在所述步驟3中,所述特征增強模塊采用了前饋神經網絡構建降噪模型,該模型一共由五層神經網絡層構成,其中輸入層輸入的是人工提取的80維聲紋特征,后面連接著三層隱藏層,每層隱藏層有1024個神經元,并采用ReLU非線性函數作為激活函數,輸出層為線性層,采用80個神經元用來實現增強特征的重構。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳信息職業技術學院,未經深圳信息職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010871239.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種雙機翼壓差式流量計用可拆卸式防護裝置
- 下一篇:一種鐵質工藝品除銹的方法





