[發(fā)明專利]一種針對(duì)MP3Stego隱寫后的音頻的隱寫檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410502396.X | 申請(qǐng)日: | 2014-09-26 |
| 公開(公告)號(hào): | CN104282310B | 公開(公告)日: | 2017-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 王讓定;羊開云;嚴(yán)迪群;金超;孫冉;周勁蕾 | 申請(qǐng)(專利權(quán))人: | 寧波大學(xué) |
| 主分類號(hào): | G10L19/018 | 分類號(hào): | G10L19/018 |
| 代理公司: | 寧波奧圣專利代理事務(wù)所(普通合伙)33226 | 代理人: | 周玨 |
| 地址: | 315211 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 針對(duì) mp3stego 隱寫后 音頻 檢測(cè) 方法 | ||
1.一種針對(duì)MP3Stego隱寫后的音頻的隱寫檢測(cè)方法,其特征在于包括以下步驟:
①選取N個(gè)變化風(fēng)格各不相同且未壓縮的WAV音頻,其中,N≥100;然后利用MP3音頻8HZ編碼器對(duì)每個(gè)WAV音頻進(jìn)行壓縮編碼,得到每個(gè)WAV音頻對(duì)應(yīng)的MP3壓縮音頻;并利用MP3Stego音頻隱寫工具對(duì)每個(gè)WAV音頻隱寫不同長(zhǎng)度、不同內(nèi)容的隱秘信息,得到每個(gè)WAV音頻對(duì)應(yīng)的隱寫MP3壓縮音頻;再將N個(gè)MP3壓縮音頻和N個(gè)隱寫MP3壓縮音頻構(gòu)成一個(gè)樣本庫(kù);
②利用MP3音頻lame解碼器對(duì)樣本庫(kù)中的每個(gè)音頻樣本進(jìn)行解壓縮,得到樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的WAV音頻,在解壓縮過程中,對(duì)樣本庫(kù)中的每個(gè)音頻樣本中的所有幀序號(hào)為偶數(shù)的幀的編碼參數(shù)量化步長(zhǎng)進(jìn)行修正;然后利用MP3音頻lame編碼器對(duì)樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的WAV音頻進(jìn)行壓縮編碼,得到樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì);
所述的步驟②中對(duì)樣本庫(kù)中的每個(gè)音頻樣本中的所有幀序號(hào)為偶數(shù)的幀的編碼參數(shù)量化步長(zhǎng)進(jìn)行修正的具體過程為:
②-1、將樣本庫(kù)中當(dāng)前待處理的第i個(gè)音頻樣本定義為當(dāng)前音頻樣本,其中,1≤i≤2N;
②-2、假設(shè)當(dāng)前音頻樣本中包含有幀,且?guī)蛱?hào)從1開始編,并將當(dāng)前音頻樣本中當(dāng)前待處理的第j幀定義為當(dāng)前幀,其中,
②-3、如果當(dāng)前幀的幀序號(hào)j為奇數(shù),則保持當(dāng)前幀的編碼參數(shù)量化步長(zhǎng)不變,然后執(zhí)行步驟②-4;如果當(dāng)前幀的幀序號(hào)j為偶數(shù),則將前一幀的編碼參數(shù)量化步長(zhǎng)作為當(dāng)前幀的編碼參數(shù)量化步長(zhǎng),完成對(duì)當(dāng)前幀的編碼參數(shù)量化步長(zhǎng)的修正,然后執(zhí)行步驟②-4;
②-4、令j=j(luò)+1,然后將當(dāng)前音頻樣本中下一幀待處理的幀作為當(dāng)前幀,再返回步驟②-3繼續(xù)執(zhí)行,直至當(dāng)前音頻樣本中的所有幀處理完畢,其中,j=j(luò)+1中的“=”為賦值符號(hào);
②-5、令i=i+1,然后將樣本庫(kù)中下一個(gè)待處理的音頻樣本作為當(dāng)前音頻樣本,再返回步驟②-2繼續(xù)執(zhí)行,直至樣本庫(kù)中的所有音頻樣本處理完畢,其中,i=i+1中的“=”為賦值符號(hào);
③利用MP3音頻lame解碼器對(duì)樣本庫(kù)中的每個(gè)音頻樣本進(jìn)行解壓縮,提取出樣本庫(kù)中的每個(gè)音頻樣本中的每幀的576個(gè)量化后的MDCT系數(shù),以每個(gè)音頻樣本中的每幀的576個(gè)量化后的MDCT系數(shù)作為一行,將樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的所有量化后的MDCT系數(shù)構(gòu)成一個(gè)第一系數(shù)矩陣,將樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的所有量化后的MDCT系數(shù)構(gòu)成的第一系數(shù)矩陣記為Xi,其中,1≤i≤2N,Xi的維數(shù)為表示樣本庫(kù)中的第i個(gè)音頻樣本中包含的幀的總數(shù),x1,1、x1,2、x1,575、x1,576對(duì)應(yīng)表示樣本庫(kù)中的第i個(gè)音頻樣本中的第1幀的第1個(gè)、第2個(gè)、第575個(gè)、第576個(gè)量化后的MDCT系數(shù),x2,1、x2,2、x2,575、x2,576對(duì)應(yīng)表示樣本庫(kù)中的第i個(gè)音頻樣本中的第2幀的第1個(gè)、第2個(gè)、第575個(gè)、第576個(gè)量化后的MDCT系數(shù),對(duì)應(yīng)表示樣本庫(kù)中的第i個(gè)音頻樣本中的第幀的第1個(gè)、第2個(gè)、第575個(gè)、第576個(gè)量化后的MDCT系數(shù);
同樣,利用MP3音頻lame解碼器對(duì)樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)進(jìn)行解壓縮,提取出樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)中的每幀的576個(gè)量化后的MDCT系數(shù),以每個(gè)載體估計(jì)中的每幀的576個(gè)量化后的MDCT系數(shù)作為一行,將樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)對(duì)應(yīng)的所有量化后的MDCT系數(shù)構(gòu)成一個(gè)第二系數(shù)矩陣,將樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)對(duì)應(yīng)的所有量化后的MDCT系數(shù)構(gòu)成的第二系數(shù)矩陣記為Xi',其中,1≤i≤2N,Xi'的維數(shù)為表示樣本庫(kù)中的第i個(gè)音頻樣本中包含的幀的總數(shù),亦表示樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)中包含的幀的總數(shù),x'1,1、x'1,2、x'1,575、x'1,576對(duì)應(yīng)表示樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)中的第1幀的第1個(gè)、第2個(gè)、第575個(gè)、第576個(gè)量化后的MDCT系數(shù),x'2,1、x'2,2、x'2,575、x'2,576對(duì)應(yīng)表示樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)中的第2幀的第1個(gè)、第2個(gè)、第575個(gè)、第576個(gè)量化后的MDCT系數(shù),對(duì)應(yīng)表示樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的載體估計(jì)中的第幀的第1個(gè)、第2個(gè)、第575個(gè)、第576個(gè)量化后的MDCT系數(shù);
④計(jì)算樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的所有量化后的MDCT系數(shù)構(gòu)成的第一系數(shù)矩陣中的每一列與該音頻樣本對(duì)應(yīng)的載體估計(jì)對(duì)應(yīng)的所有量化后的MDCT系數(shù)構(gòu)成的第二系數(shù)矩陣中對(duì)應(yīng)列之間的Hausdorff距離值,將樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的576個(gè)Hausdorff距離值構(gòu)成一個(gè)初級(jí)隱寫分析特征行向量,將樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的576個(gè)Hausdorff距離值構(gòu)成的初級(jí)隱寫分析特征行向量記為Fi,F(xiàn)i=[hd1 hd2 … hdk … hd575 hd576],其中,1≤i≤2N,hdk表示Xi中的第k列與Xi'中的第k列之間的Hausdorff距離值,1≤k≤576;
⑤根據(jù)樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的576個(gè)Hausdorff距離值構(gòu)成的初級(jí)隱寫分析特征行向量,獲取樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的最終隱寫分析特征行向量,將樣本庫(kù)中的第i個(gè)音頻樣本對(duì)應(yīng)的最終隱寫分析特征行向量記為Fi',F(xiàn)i'=[μi mi σi pi si],其中,1≤i≤2N,μi表示Fi中的所有元素的均值,mi表示Fi中的所有元素中的最大值,mi=max(hd1,hd2,...,hdk,...,hd576),max()為取最大值函數(shù),σi表示Fi中的所有元素的方差,pi表示Fi中的所有元素的峰度系數(shù),si表示Fi中的所有元素的三階中心距,
⑥對(duì)樣本庫(kù)中的每個(gè)音頻樣本對(duì)應(yīng)的最終隱寫分析特征行向量進(jìn)行標(biāo)記,對(duì)于樣本庫(kù)中的第i個(gè)音頻樣本,如果該音頻樣本為MP3壓縮音頻,則將該音頻樣本對(duì)應(yīng)的最終隱寫分析特征行向量標(biāo)記為-1,如果該音頻樣本為隱寫MP3壓縮音頻,則將該音頻樣本對(duì)應(yīng)的最終隱寫分析特征行向量標(biāo)記為+1,其中,1≤i≤2N;然后將所有標(biāo)記后的最終隱寫分析特征行向量輸入SVM分類器進(jìn)行訓(xùn)練,得到訓(xùn)練模板;
⑦對(duì)于任意一個(gè)待檢測(cè)的MP3壓縮音頻,按照步驟②至步驟⑤的過程,以相同的方式獲取該MP3壓縮音頻對(duì)應(yīng)的最終隱寫分析特征行向量,然后利用訓(xùn)練模板對(duì)該MP3壓縮音頻對(duì)應(yīng)的最終隱寫分析特征行向量進(jìn)行檢測(cè),以確定該MP3壓縮音頻是否經(jīng)過MP3Stego音頻隱寫工具隱寫。
2.根據(jù)權(quán)利要求1所述的一種針對(duì)MP3Stego隱寫后的音頻的隱寫檢測(cè)方法,其特征在于所述的步驟④中Xi中的第k列與Xi'中的第k列之間的Hausdorff距離值hdk的獲取過程為:
④-1、將Xi中的第k列記為Ci,k,將Xi'中的第k列記為C'i,k;
④-2、將Ci,k中當(dāng)前待處理的第j個(gè)元素定義為當(dāng)前元素,其中,
④-3、計(jì)算當(dāng)前元素與C'i,k中的每個(gè)元素之間的歐氏距離,得到當(dāng)前元素對(duì)應(yīng)的個(gè)歐氏距離,然后獲取當(dāng)前元素對(duì)應(yīng)的個(gè)歐氏距離中的最小歐氏距離值;
④-4、令j=j(luò)+1,然后將Ci,k中下一個(gè)待處理的元素作為當(dāng)前元素,再返回步驟④-3繼續(xù)執(zhí)行,直至Ci,k中的所有元素處理完畢,得到Ci,k中的每個(gè)元素對(duì)應(yīng)的一個(gè)最小歐氏距離值,其中,j=j(luò)+1中的“=”為賦值符號(hào);
④-5、獲取Ci,k對(duì)應(yīng)的個(gè)最小歐氏距離值中的最大值,然后將該最大值作為Xi中的第k列與Xi'中的第k列之間的Hausdorff距離值,記為hdk。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于寧波大學(xué),未經(jīng)寧波大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410502396.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種紙張和紙板表面整飾劑
- 下一篇:一種勾花多軸向織物的制造方法
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 一種基于隱寫分析系統(tǒng)盲性的隱寫分析方法
- 一種基于共生矩陣分析的MP3音頻隱寫檢測(cè)方法
- 一種圖像隱寫分析方法以及其裝置
- 一種具有隱寫和加密功能的隱蔽云存儲(chǔ)系統(tǒng)
- 一種基于空域特性的JPEG圖像自適應(yīng)隱寫方法
- 一種基于殘差共生概率的隱寫圖像載體安全性評(píng)價(jià)方法
- 基于Gabor濾波和卷積神經(jīng)網(wǎng)絡(luò)的圖像隱寫檢測(cè)方法
- 基于CNN的自適應(yīng)音頻隱寫方法和秘密信息提取方法
- 一種基于Tucker分解的圖像隱寫分析方法及終端
- 一種基于深度學(xué)習(xí)的高動(dòng)態(tài)范圍圖像隱寫和恢復(fù)方法
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





