[發明專利]基于系數相關模型的MP3音頻隱寫分析方法及裝置在審
| 申請號: | 201910586062.8 | 申請日: | 2019-07-01 |
| 公開(公告)號: | CN110390941A | 公開(公告)日: | 2019-10-29 |
| 發明(設計)人: | 黃永峰;楊浩;鮑永健;楊忠良;楊震 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L19/018 | 分類號: | G10L19/018;G10L25/30 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模式系數 系數矩陣 隱寫分析 向量 循環神經網絡 量化編碼 模型比較 模型輸入 手工特征 特征分類 隱寫檢測 分析 算法 耗時 分類 檢測 概率 網絡 | ||
1.一種基于系數相關模型的MP3音頻隱寫分析方法,其特征在于,包括以下步驟:
獲取待分析的MP3音頻QMDCT系數矩陣,以將所述QMDCT系數作為模型輸入;
通過循環神經網絡從所述MP3音頻QMDCT系數矩陣中提取多種QMDCT相關模式系數向量;
通過特征分類網絡對所述待分析的音頻相關模式系數向量進行分類,獲取待分析的MP3音頻是否進行隱寫的概率。
2.根據權利要求1所述的方法,其特征在于,每一個MP3音頻得到的QMDCT系數序列表示為:
X=[x1,x2,…,xK],
其中,xK為每一幀量化之后的系數向量。
3.根據權利要求2所述的方法,其特征在于,還包括:
使用系數相關提取模型所述對QMDCT系數序列進行相關分析,得到系數相關特征向量。
4.根據權利要求1所述的方法,其特征在于,所述特征分類網絡為:
st=tanh(Wt·yt+bt),
Zk=Vk*sk+bk,
其中,s是特征分類網絡的中間層輸出,Zk是對應預設類別的輸出值。
5.根據權利要求4所述的方法,其特征在于,隱寫檢測公式為:
其中,z為輸出的概率值,threshold為預設的判斷閾值,T為模型的類別標簽。
6.一種基于系數相關模型的MP3音頻隱寫分析裝置,其特征在于,包括:
獲取模塊,用于獲取待分析的MP3音頻QMDCT系數矩陣,以將所述QMDCT系數作為模型輸入;
提取模塊,用于通過循環神經網絡從所述MP3音頻QMDCT系數矩陣中提取多種QMDCT相關模式系數向量;
分類模塊,用于通過特征分類網絡對所述待分析的音頻相關模式系數向量進行分類,獲取待分析的MP3音頻是否進行隱寫的概率。
7.根據權利要求6所述的裝置,其特征在于,每一個MP3音頻得到的QMDCT系數序列表示為:
X=[x1,x2,…,xK],
其中,xK為每一幀量化之后的系數向量。
8.根據權利要求7所述的裝置,其特征在于,還包括:
分析模塊,用于使用系數相關提取模型所述對QMDCT系數序列進行相關分析,得到系數相關特征向量。
9.根據權利要求6所述的裝置,其特征在于,所述特征分類網絡為:
st=tanh(Wt·yt+bt),
Zk=Vk*sk+bk,
其中,s是特征分類網絡的中間層輸出,Zk是對應預設類別的輸出值。
10.根據權利要求9所述的裝置,其特征在于,隱寫檢測公式為:
其中,z為輸出的概率值,threshold為預設的判斷閾值,T為模型的類別標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910586062.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:音頻分發系統
- 下一篇:基于嬰兒哭聲的情緒檢測方法及其裝置





