[發明專利]一種基于布谷鳥搜索算法的聲紋識別攻擊防御方法有效
| 申請號: | 201910819972.6 | 申請日: | 2019-08-31 |
| 公開(公告)號: | CN110610708B | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 陳晉音;鄭喆;葉林輝 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04;G10L17/02;G10L17/18;G06N3/00;G06N3/04;H04L9/00 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 布谷鳥 搜索 算法 聲紋 識別 攻擊 防御 方法 | ||
一種基于布谷鳥搜索算法的聲紋識別攻擊防御方法,包括:(1)準備原始音頻數據集;(2)訓練聲紋識別模型:利用預訓練數據集對聲紋識別模型進行訓練,然后使用測試數據集測試識別模型的準確率;(3)攻擊聲紋識別模型:搭建基于布谷鳥搜索算法的攻擊方法,設置適應度函數及攻擊方法的相關參數;利用該攻擊方法生成最優對抗樣本,使其被錯誤識別成目標類別而不被人耳所識別;(4)對抗訓練聲紋識別模型:將步驟(3)中生成的樣本加入預訓練數據集中,重新訓練聲紋識別模型,使得重新訓練的聲紋識別模型具有防御對抗樣本攻擊的能力,提高聲紋識別模型的安全性和穩定性。
技術領域
本發明屬于深度學習算法及信息安全研究領域,具體涉及一種基于布谷鳥算法的聲紋識別系統攻擊防御方法。
背景技術
聲紋識別作為一種生物識別技術,通過提取說話者聲音中的獨特特征,對不同人的聲音進行有效的區分。由于蘊含聲紋特征的語音容易獲取,且辨認的算法復雜度較低,使得聲紋識別系統具有較為廣泛的應用。已有的聲紋識別技術分為文本相關和文本無關兩種,文本相關的聲紋識別模型要求用戶按照規定內容發音,每個人的聲紋模型被精確建立,但是在識別時也必須按規定內容發音,可以達到較好的識別效果,但一旦用戶發音內容有誤會造成無法正確識別的情況。文本無關的聲紋識別模型則不需要規定用戶的發音內容,使得識別較為方便,應用范圍較為廣泛。
基于深度學習的聲紋識別系統為人們的生產生活帶來了極大的便利,但同時也容易受到對抗樣本的攻擊。攻擊者在原始音頻中添加精心計算的擾動,可以使得聲紋識別結果發生改變,能夠使音頻被識別成特定的說話者,這樣極有可能損害用戶的個人信息甚至人身安全。
已有的聲紋識別攻擊方法主要分為白盒攻擊和黑盒攻擊。黑盒攻擊方法在未知模型內部參數的情況下,利用遺傳算法、粒子群算法等優化算法計算得到最優擾動,使生成的對抗音頻與原始音頻在人耳不能發覺的情況下能夠被分類成目標說話者。白盒攻擊方法需要在了解模型內部的參數的情況下,通過反向傳播算法計算梯度并更新模型參數。另外,攻擊者還利用麥克風等設備的非線性,通過添加不在人耳識別頻率范圍內的噪聲實現攻擊。這些噪聲在經過麥克風后能夠被聲紋識別系統識別。常用的語音識別防御方法分為檢測對抗樣本、對抗訓練等,對抗訓練通過將生成對抗樣本加入原始訓練數據集中重新訓練聲紋識別模型使得模型具備防御對抗樣本的能力。對抗樣本檢測的方法通過在識別前加入檢測程序,使之能夠辨別檢測出對抗樣本,并拒絕識別,使得聲紋識別模型免受對抗樣本的攻擊。
發明內容
本發明要克服現有聲紋識別系統存在容易受到對抗樣本攻擊的安全性問題,提供一種基于布谷鳥搜索算法的聲紋識別攻擊防御方法,該方法可以高效生成對抗樣本使得識別系統發生錯誤識別,并利用對抗訓練的方式,將生成的對抗樣本加入原始訓練數據集中,經過對抗訓練后的聲紋識別模型能夠防御對抗樣本的攻擊,具有更高的安全性。
一種基于布谷鳥搜索算法的聲紋識別攻擊防御方法,主要包括以下步驟:
(1)準備原始音頻數據集:采集不同說話者說不同內容的語音音頻,按照一定比例分成預訓練數據集、測試數據集和用于生成對抗樣本的擾動數據集,并對音頻進行預處理;
Step1:采集不同的說話者說確定內容的音頻,即設共有M個不同的說話者,N個不同的說話內容,則每一個樣本可以表示為xij(1≤i≤M,1≤j≤N),即第i個說話者說第j個內容的音頻樣本。
為了使聲紋識別模型具有較強的穩定性,在噪聲環境下也能夠提取有效信息實現正確的識別,采集的音頻樣本中包括安靜和嘈雜環境。同時在音頻采集過程中改變說話者和錄音設備的距離,來模擬真實聲紋識別場景中的說話者音量大小不一致的情形。為了提高后續聲紋識別的準確率,在采集音頻的過程中盡可能保證說話者的發音較為標準。
Step2:將上述采集的音頻進行裁剪以及添加相應的標簽并處理成數據流格式的音頻文件,作為訓練、測試聲紋識別模型以及生成對抗樣本所需要的數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910819972.6/2.html,轉載請聲明來源鉆瓜專利網。





