[發(fā)明專利]一種基于Mask R-CNN圖像篡改檢測方法有效
| 申請?zhí)枺?/td> | 202010122303.6 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111340784B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計)人: | 徐超;宣錦昭;馮博;閃文章 | 申請(專利權(quán))人: | 安徽大學(xué) |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G06T5/00;G06V10/764;G06V10/82 |
| 代理公司: | 北京睿智保誠專利代理事務(wù)所(普通合伙) 11732 | 代理人: | 周新楣 |
| 地址: | 230000*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 mask cnn 圖像 篡改 檢測 方法 | ||
1.一種基于MaskR-CNN圖像篡改檢測方法,其特征在于,包括以下步驟:
S10、基于MaskR-CNN構(gòu)建圖像篡改檢測網(wǎng)絡(luò),所述圖像篡改檢測網(wǎng)絡(luò)包括主分支網(wǎng)絡(luò)、噪聲分支網(wǎng)絡(luò)、Resnet-FPN骨干網(wǎng)絡(luò)、RPN區(qū)域提議網(wǎng)絡(luò)和ROIAlign雙線性池化網(wǎng)絡(luò);
S20、將篡改圖像輸入所述主分支網(wǎng)絡(luò);所述主分支網(wǎng)絡(luò)提取篡改圖像特征并輸入所述Resnet-FPN骨干網(wǎng)絡(luò);
S30、輸入所述主分支網(wǎng)絡(luò)的所述篡改圖像經(jīng)過SRM濾波層提取篡改圖像的局部噪聲特征;將所述局部噪聲特征輸入所述噪聲分支網(wǎng)絡(luò);
S40、所述噪聲分支網(wǎng)絡(luò)識別所述篡改圖像局部噪聲特征和噪聲分類特征,并輸入到所述Resnet-FPN骨干網(wǎng)絡(luò);
S50、根據(jù)輸入的所述篡改圖像特征、所述局部噪聲特征和所述噪聲分類特征通過所述Resnet-FPN骨干網(wǎng)絡(luò)的FPN產(chǎn)生圖像特征金字塔;
所述圖像特征金字塔包括邊界特征金字塔、圖像分類特征金字塔和圖像噪聲特征金字塔;
S60、將所述圖像分類特征金字塔和圖像噪聲特征金字塔輸入所述ROI?Align雙線性池化網(wǎng)絡(luò);
S70、所述邊界特征金字塔輸入所述RPN區(qū)域提議網(wǎng)絡(luò)產(chǎn)生圖像篡改候選區(qū)域特征,并輸入所述ROIAlign雙線性池化網(wǎng)絡(luò);
S80、所述ROIAlign雙線性池化網(wǎng)絡(luò)對輸入的所述圖像分類特征、圖像噪聲特征和所述圖像篡改候選區(qū)域特征進(jìn)行特征合并,并輸出所述篡改圖像的分類、篡改區(qū)域定位和圖像分割結(jié)果;
S90、使用數(shù)據(jù)集對圖像篡改檢測神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、測試;所述數(shù)據(jù)集為基于PASCALVOC數(shù)據(jù)集合成創(chuàng)建了新的篡改數(shù)據(jù)集(PASCALVOC-TP);所述新的篡改數(shù)據(jù)集(PASCALVOC-TP)包括篡改圖像、篡改區(qū)域坐標(biāo)值和篡改區(qū)域的掩碼值;
S100、將篡改圖像輸入訓(xùn)練完成后的圖像篡改檢測網(wǎng)絡(luò),得到篡改圖像的分類、篡改區(qū)域定位和圖像分割掩碼預(yù)測。
2.權(quán)利要求1所述的圖像篡改檢測方法,其特征在于,步驟S30中所述SRM濾波層包括3個基本濾波器,所述基本濾波器的內(nèi)核為:
3.權(quán)利要求1所述的圖像篡改檢測方法,其特征在于,步驟S50中所述圖像特征金字塔結(jié)構(gòu)為[P2,P3,P4,P5,P6],對于輸入網(wǎng)絡(luò)的原圖上w×h的ROI,選擇的合適特征圖的尺度Pk,通過如下公式進(jìn)行定義:
其中,w×h表示ROI面積,K0設(shè)置為4,224為ImageNet輸入圖像大小。
4.權(quán)利要求1所述的圖像篡改檢測方法,其特征在于,步驟S70中所述RPN區(qū)域提議網(wǎng)絡(luò)會對所述邊界特征進(jìn)行修正,所述RPN區(qū)域提議網(wǎng)絡(luò)修正損失定義為:
其中pi表示在一個mini-batch中錨點i是篡改區(qū)域的預(yù)測概率,表示正錨點i相關(guān)聯(lián)的真值,ti={tx,ty,tw,th}表示預(yù)測的4個參數(shù)化坐標(biāo),是正錨點對應(yīng)的真值坐標(biāo);Lcls表示RPN網(wǎng)絡(luò)的交叉熵?fù)p失,Lreg表示smoothL1損失;Ncls表示RPN網(wǎng)絡(luò)中mini-batch的的大小,Nreg表示錨點的數(shù)量;λ表示平衡這兩個損失的超參數(shù)。
5.權(quán)利要求1所述的圖像篡改檢測方法,其特征在于,所述篡改圖像為三通道(RGB)彩色圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽大學(xué),未經(jīng)安徽大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122303.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像語義標(biāo)注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測
- 針對深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機(jī)設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時空特征學(xué)習(xí)與情感分類方法
- 一種基于FPGA的深度學(xué)習(xí)加速方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





