[發明專利]一種黑盒場景下的定向對抗音頻生成方法及系統在審
| 申請號: | 201910060662.0 | 申請日: | 2019-01-22 |
| 公開(公告)號: | CN109887496A | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 紀守領;杜天宇;李進鋒;陳建海 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/02;G10L25/24 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 源音頻 音頻識別 黑盒 對抗 攻擊目標 目標函數 語音識別 重采樣 噪聲 粒子群算法 場景 模型識別 輸入音頻 選擇目標 樣本生成 采樣率 選擇源 擾動 疊加 | ||
1.一種黑盒場景下的定向對抗音頻生成方法,其特征在于,包括以下步驟:
(1)選擇目標黑盒語音識別模型作為音頻識別模型,選擇源音頻并設定攻擊目標;
(2)根據音頻識別模型對輸入音頻采樣率的要求,對源音頻進行重采樣;
(3)提取重采樣后源音頻的MFCC特征;
(4)采用音頻識別模型對所述的MFCC特征進行識別,得到識別結果;
(5)設定目標函數,利用粒子群算法尋找使目標函數值最小的最佳噪聲,將最佳噪聲與源音頻疊加,獲得識別結果為攻擊目標的定向對抗音頻。
2.根據權利要求1所述的黑盒場景下的定向對抗音頻生成方法,其特征在于,所述的黑盒語音識別模型為對語音進行分類且輸出類別固定的語音識別模型。
3.根據權利要求1所述的黑盒場景下的定向對抗音頻生成方法,其特征在于,步驟(3)包括:
(3-1)對預處理后的音頻進行預加重處理,使音頻的頻譜變得平坦;
(3-2)之后將音頻分成若干幀,并將每一幀乘以漢明窗;
(3-3)對各幀音頻進行快速傅里葉變換,得到各幀音頻的頻譜,從音頻的頻譜獲得音頻的能量譜;
(3-4)將音頻的能量譜通過一組Mel尺度的三角形濾波器組;
(3-5)計算每個三角形濾波器輸出的對數能量,將對數能量經離散余弦變換,得到MFCC系數階數階的Mel-scaleCepstrum參數;提取音頻的動態差分參數;
(3-6)得到MFCC特征。
4.根據權利要求3所述的黑盒場景下的定向對抗音頻生成方法,其特征在于,MFCC特征提取中的參數為:預加重參數為0.97;512個采樣點為一幀,幀與幀之間的重疊區域包含171個采樣點,加窗參數為0.46;快速傅立葉變換點數為512;三角形濾波器個數為26;MFCC階數為16。
5.根據權利要求1所述的黑盒場景下的定向對抗音頻生成方法,其特征在于,所述的目標函數為:
其中,x為源音頻,pi(i=1,...,N)為第i個粒子,N為正整數;f(x+pi)j為音頻識別模型針對輸入x+pi輸出為第j類結果的概率;t為攻擊目標,f(x+pi)t為音頻識別模型針對輸入x+pi輸出為t的概率;參數κ為小于等于0的常數。
6.根據權利要求5所述的黑盒場景下的定向對抗音頻生成方法,其特征在于,步驟(5)中,利用粒子群算法尋找使目標函數值最小的最佳噪聲,包括:
(5-1)將迭代次數初始化為0,均勻分布生成N個粒子pi(i=1,...,N),粒子的長度與源音頻長度相同;
(5-2)將每個粒子pi分別與源音頻x疊加,得到N個音頻x+pi;
(5-3)提取音頻x+pi的MFCC特征,采用音頻識別模型對音頻x+pi的MFCC特征進行識別,得到每個音頻x+pi的識別結果,并計算其目標函數值g(x+pi);
若存在任一音頻x+pi的識別結果為攻擊目標,則攻擊成功,粒子pi即為最佳噪聲;
否則,執行步驟(5-4);
(5-4)將迭代次數加1,均勻分布生成N-1個粒子pi(i=1,...,N-1),并將上一輪次中具有最小目標函數值的粒子加入,作為下一輪迭代的種子;
重復步驟(5-2)~(5-3),直至目標函數收斂,獲得使目標函數收斂的粒子pi,即為最佳噪聲;
若迭代次數達到設定的最大迭代次數時目標函數仍未收斂,則攻擊失敗。
7.一種黑盒場景下的定向對抗音頻生成系統,其特征在于,包括:
數據預處理模塊,對源音頻數據進行重采樣,使源音頻的采樣率符合黑盒語音識別模型對輸入音頻采樣率的要求;
音頻特征提取模塊,提取音頻數據的MFCC特征;
音頻識別模塊,具有黑盒語音識別模型,所述黑盒語音識別模型對音頻的MFCC特征進行識別,得到識別結果;
粒子群優化模塊,具有目標函數,利用粒子群算法尋找最佳噪音,將最佳噪音加入源音頻,得到定向對抗音頻。
所述定向對抗音頻生成系統采用所述的定向對抗音頻生成方法生成定向對抗音頻;
所述的定向對抗音頻生成系統采用權利要求1~6任一項所述的定向對抗音頻生成方法生成定向對抗音頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910060662.0/1.html,轉載請聲明來源鉆瓜專利網。





