[發明專利]基于系數相關模型的MP3音頻隱寫分析方法及裝置在審
| 申請號: | 201910586062.8 | 申請日: | 2019-07-01 |
| 公開(公告)號: | CN110390941A | 公開(公告)日: | 2019-10-29 |
| 發明(設計)人: | 黃永峰;楊浩;鮑永健;楊忠良;楊震 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L19/018 | 分類號: | G10L19/018;G10L25/30 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模式系數 系數矩陣 隱寫分析 向量 循環神經網絡 量化編碼 模型比較 模型輸入 手工特征 特征分類 隱寫檢測 分析 算法 耗時 分類 檢測 概率 網絡 | ||
本發明公開了一種基于系數相關模型的MP3音頻隱寫分析方法及裝置,其中,方法包括以下步驟:獲取待分析的MP3音頻QMDCT系數矩陣,以將QMDCT系數作為模型輸入;通過循環神經網絡從MP3音頻QMDCT系數矩陣中提取多種QMDCT相關模式系數向量;通過特征分類網絡對待分析的音頻相關模式系數向量進行分類,獲取待分析的MP3音頻是否進行隱寫的概率。該方法能夠對多種基于MP3量化編碼過程的隱寫算法都能實現較高的隱寫檢測率,有一定通用性,并在模型上去除了對于手工特征的依賴,且設計的模型比較簡單,能夠實現較低的檢測耗時。
技術領域
本發明涉及數字音頻隱寫檢測技術領域,特別涉及一種基于系數相關模型的MP3音頻隱寫分析方法及裝置。
背景技術
現有的針對MP3壓縮域隱寫檢測方法可以簡單的分成兩類,一類是傳統方法,一類是采用深度學習的方式,傳統方式主要通過人手工的提取特征,然后使用分類器來進行分類。
基于深度學習的檢測方法則大部分使用神經網絡來進行特征提取并分類。基于MP3壓縮域隱寫檢測的方法的輸入主要以QMDCT(Quantified Modified Discrete CosineTransform,音頻量化修正余弦變換系數矩陣)為主。對于一個MP3音頻而言,通常來說對于給定幀數的音頻,每一幀可以得到n*576個QMDCT系數,其中n取決是聲道數量以及顆粒數量?,F有的基于QMDCT系數進行分析的傳統代表性隱寫算法主要有ADOTP隱寫分析以及MDI2算法,其中ADOTP算法首先使用一階差分對QMDCT系數那個濾波,然后使用markov矩陣對系數進行建模提取特征,然后輸入到分類器中進行訓練。MDI2算法則分別計算了各個行列的差分,然后計算markov單步轉移概率,將特征輸入分類器進行計算?;谏疃葘W習的算法如多尺度相關也基本上采用了先手動設計高通濾波過濾的方式來進行特征構建,然后使用神經網絡的方式來進行進一步的特征提取。
總體來看,此前的方法不管是傳統方法還是神經網絡方法主要是依賴于手工提取特征(涉及到設計濾波器),有一定的主觀性,傳統方法忽略了高階的轉移特征,原因在于提取復雜度過高,基于深度學習的方法則主要以卷積神經網絡建模為主,側重于層次特征,且一般構建的深度網絡層數過多,檢測耗時太長。另外,此前的檢測算法在通用性以及復雜條件下的檢測率普遍不高。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的一個目的在于提出一種基于系數相關模型的MP3音頻隱寫分析方法,該方法能夠實現較高的隱寫分析檢測率,且在低嵌入率條件下依然表現良好,并且系數相關模型復雜度相對較低,能夠保證較好的實時檢測性能。
本發明的另一個目的在于提出一種基于系數相關模型的MP3音頻隱寫分析裝置。
為達到上述目的,本發明一方面實施例提出了一種基于系數相關模型的MP3音頻隱寫分析方法,包括以下步驟:獲取待分析的MP3音頻QMDCT系數矩陣,以將所述QMDCT系數作為模型輸入;通過循環神經網絡從所述MP3音頻QMDCT系數矩陣中提取多種QMDCT相關模式系數向量;通過特征分類網絡對所述待分析的音頻相關模式系數向量進行分類,獲取待分析的MP3音頻是否進行隱寫的概率。
本發明實施例的基于系數相關模型的MP3音頻隱寫分析方法,以序列的觀點重新建模MP3音頻序列,并使用循環神經網絡構建系數相關模型從而捕捉幀與幀之間,幀內各個系數之間的相關特征,并直接使用QMDCT系數而去掉了手工濾波的過程,且能夠建模比較遠距離的系數依賴和系數的方向信息,從而能夠實現較高的隱寫分析檢測率,且在低嵌入率條件下依然表現良好,并且系數相關模型復雜度相對較低,能夠保證較好的實時檢測性能。
另外,根據本發明上述實施例的基于系數相關模型的MP3音頻隱寫分析方法還可以具有以下附加的技術特征:
進一步地,在本發明的一個實施例中,每一個MP3音頻得到的QMDCT系數序列表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910586062.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:音頻分發系統
- 下一篇:基于嬰兒哭聲的情緒檢測方法及其裝置





