[發明專利]一種歸一化常Q倒譜特征的回放語音檢測方法有效
| 申請號: | 201811451509.2 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109243487B | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 勞靈杰;嚴迪群;葉勇超;林朗 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/27;G10L25/51 |
| 代理公司: | 寧波誠源專利事務所有限公司 33102 | 代理人: | 袁忠衛 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 歸一化 特征 回放 語音 檢測 方法 | ||
本發明提供一種高魯棒性的歸一化常Q倒譜特征的回放語音檢測方法,包括提取原始語音和回放語音的語音信息X(n)的聲學特征CQCC系數;對原始語音和回放語音的CQCC系數進行倒譜均值和方差歸一化處理,得到歸一化的CQCC系數;將該系數置于混合高斯模型中進行訓練,得到原始語音模型和回放語音模型;提取待測語音的語音信息X(n)的聲學特征CQCC系數;對待測語音的CQCC系數進行倒譜均值和方差歸一化處理,得到歸一化的CQCC系數;將待測語音歸一化的CQCC系數置于原始語音模型和回放語音模型中進行匹配,并判斷待測語音歸一化的CQCC系數與回放語音模型的第一匹配度是否大于等于與原始語音模型的第二匹配度,若是,則為回放語音,若否,則不是回放語音。
技術領域
本發明涉及回放語音的檢測識別方法,具體是指一種歸一化常Q倒譜特征的回放語音檢測方法。
背景技術
隨著現代社會的不斷發展,信息安全問題日顯突出,其中身份認證在信息安全防護中承擔著至關重要的作用。密碼是最常見的身份認證方式之一,但其存在容易被遺忘、安全性低等問題,因此國內外學者提出了將人體特征應用于身份認證的生物識別技術,而聲紋識別技術就是其中之一。相較于指紋、人臉等生物認證方式,聲紋具有易采集、可遠程等特點,因而被廣泛應用于公安、金融等領域。近年來,隨著語音處理技術的快速發展,出現了諸如合成轉換、電子變調以及錄音回放等聲紋偽造攻擊手段,對基于聲紋的身份認證系統構成了嚴重威脅。其中錄音回放攻擊是一種簡單且易操作的攻擊手段,攻擊者通過隱蔽性較高的錄音設備,對目標說話人的語音進行偷錄,并以偷錄的語音來欺騙聲紋認證系統。這類攻擊由于不需要對回放語音進行額外的操作,從而避免了因修改語音而留下操作痕跡,同時回放語音與原始語音具有較高的相似度,現有的聲紋認證系統通常無法正確判斷兩者之間的差別。
現有技術中針對回放語音的檢測方法,按檢測原理的不同,可以分為基于語音產生隨機性的方法、基于語音信道特性的方法以及基于深度學習的方法:由于同一個人在不同時刻說出相同的內容所產生的語音信息存在較大的隨機性,Shang等人提出了一種基于語音產生隨機性的回放語音檢測算法,該算法通過比較原始語音與待測語音在波峰圖上的差異,判斷其是否為回放語音,在隨后的研究中,作者又通過得分歸一化的方法對檢測算法進行了改進;Jakub Galka等則在Shang算法的基礎上,將波峰圖中各頻率點的位置關系作為檢測特征,但該方法只能應用于文本相關的聲紋識別系統中,且檢測時長較長,局限性較大;此外,由于回放語音在錄制過程中會經過偷錄設備的編碼和回放設備的解碼等環節,同時還會受到偷錄時周圍環境的影響,因此相比于原始語音會引入更多的失真,基于此,出現了基于語音產生信道的回放語音檢測算法,如Zhang利用回放語音的失真現象,提出了一種基于靜音段梅爾倒譜系數對語音信道進行建模的方法,通過比較待測語音的信道與已建立的模型,進而判斷待測語音是否為回放語音;王志峰著重研究低頻段的信道噪聲,提取了6階Legendre多項式系數及系數所對應的統計特征,在此基礎上利用SVM訓練噪聲分類模型,并得到了很好的分類結果;近年來,隨著深度學習在計算機視覺、自然語言處理等領域的廣泛應用,也有相關學者將嘗試將該技術應用于回放語音的檢測,Lin等通過基于電網頻率(ENF)的分析對特征進行預處理,并用卷積神經網絡(CNN)對原始語音和回放語音進行訓練和分類,由于ENF僅存在于由電網供電的偷錄設備中(比如錄音機),同時ENF信號提取的準確性會極大地影響檢測方法的性能,因此該方法應用范圍有較大的局限性。
綜上所述,現有技術中所提出的檢測方法往往面臨需要文本相關、檢測時間長等問題,且很少有關于多種翻錄回放設備或是不同環境下回放的檢測方法。但隨著電子設備小型化多樣化的發展,實際場景中,聲紋認證系統將面臨多種錄音回放設備的攻擊,而不同的設備可能對系統的性能產生不同的影響。鑒于此,有必要提供一種高準確率、高魯棒性、且高效的回放語音檢測方法。
發明內容
本發明所要解決的技術問題在于克服現有技術的缺陷而提供一種高準確率、高魯棒性、且高效的歸一化常Q倒譜特征的回放語音檢測方法。
本發明的技術問題通過以下技術方案實現:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811451509.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于機器學習的反黑飛聲探測方法
- 下一篇:音頻檢測方法、裝置及存儲介質





