[發(fā)明專利]一種基于Mask R-CNN圖像篡改檢測方法有效
| 申請?zhí)枺?/td> | 202010122303.6 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111340784B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計)人: | 徐超;宣錦昭;馮博;閃文章 | 申請(專利權(quán))人: | 安徽大學(xué) |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G06T5/00;G06V10/764;G06V10/82 |
| 代理公司: | 北京睿智保誠專利代理事務(wù)所(普通合伙) 11732 | 代理人: | 周新楣 |
| 地址: | 230000*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 mask cnn 圖像 篡改 檢測 方法 | ||
本發(fā)明公開了一種基于改進(jìn)的Mask?R?CNN圖像篡改檢測方法,屬于圖像識別技術(shù)領(lǐng)域,包括以下步驟:基于Mask?R?CNN構(gòu)建圖像篡改檢測網(wǎng)絡(luò);圖像篡改檢測網(wǎng)絡(luò)包括主分支網(wǎng)絡(luò)、噪聲分支網(wǎng)絡(luò)、Resnet?FPN骨干網(wǎng)絡(luò)、區(qū)域提議網(wǎng)絡(luò)RPN和雙線性池化ROI?Align網(wǎng)絡(luò);將篡改圖像輸入圖像篡改檢測網(wǎng)絡(luò)對輸入的圖像分類特征、噪聲特征和篡改候選區(qū)域特征進(jìn)行特征合并,并輸出篡改圖像的分類、篡改區(qū)域定位和圖像分割結(jié)果;用數(shù)據(jù)集對圖像篡改檢測神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、測試;通過訓(xùn)練后的圖像篡改檢測網(wǎng)絡(luò),得到篡改圖像的分類、篡改區(qū)域定位和圖像分割掩碼預(yù)測。本發(fā)明通過基于Mask?R?CNN的圖像篡改檢測網(wǎng)絡(luò),進(jìn)行篡改圖像的分類、篡改區(qū)域定位和分割操縱區(qū)域,實(shí)現(xiàn)了對篡改圖像像素級的預(yù)測。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種基于Mask?R-CNN圖像篡改檢測方法。
背景技術(shù)
隨著高分辨率數(shù)碼相機(jī)和功能強(qiáng)大的數(shù)字圖像處理軟件的普遍采用使得篡改圖片變得更加真實(shí)。由于數(shù)字圖像容易篡改引發(fā)了一系列的虛假圖像事件問題,如篡改者有目的地篡改圖像,用于司法取證,新聞報道,醫(yī)學(xué)鑒定時,其引發(fā)的問題會造成不可估量的損失。圖像拼接是圖像偽造的最常見類型之一。它通過找出兩幅具有標(biāo)志特征的像素點(diǎn),并利用相應(yīng)的技術(shù)手段將一副圖像中的特征像素逐漸變?yōu)榱硪粋€圖像中的特征像素。
現(xiàn)有的篡改檢測方法只能推斷出給定的圖像是否偽造,但是不能同時定位拼接區(qū)域和分割掩碼(mask)區(qū)域。
因此,急需一種能夠判斷是圖像否偽造,同時能夠給出拼接區(qū)域和分割掩碼的圖像篡改檢測方法。
發(fā)明內(nèi)容
本發(fā)明目的在于提供一種能夠判斷圖像是否偽造,同時能夠給出拼接區(qū)域和分割掩碼的圖像篡改檢測方法,發(fā)明的內(nèi)容如下:
一種基于Mask?R-CNN圖像篡改檢測方法,包括以下步驟:
S10、基于Mask?R-CNN構(gòu)建圖像篡改檢測網(wǎng)絡(luò),所述圖像篡改檢測網(wǎng)絡(luò)包括主分支網(wǎng)絡(luò)、噪聲分支網(wǎng)絡(luò)、Resnet-FPN骨干網(wǎng)絡(luò)、RPN區(qū)域提議網(wǎng)絡(luò)和ROI?Align雙線性池化網(wǎng)絡(luò);
S20、將所述篡改圖像輸入所述主分支網(wǎng)絡(luò);所述主分支網(wǎng)絡(luò)提取篡改圖像特征并輸入所述Resnet-FPN骨干網(wǎng)絡(luò);
S30、輸入所述主分支網(wǎng)絡(luò)的所述篡改圖像經(jīng)過SRM濾波層提取篡改圖像的局部噪聲特征;將所述局部噪聲特征輸入所述噪聲分支網(wǎng)絡(luò);
S40、所述噪聲分支網(wǎng)絡(luò)識別所述篡改圖像局部噪聲特征和噪聲分類特征,并輸入到所述Resnet-FPN骨干網(wǎng)絡(luò);
S50、根據(jù)輸入的所述篡改圖像特征、所述局部噪聲特征和所述噪聲分類特征通過所述Resnet-FPN骨干網(wǎng)絡(luò)的FPN產(chǎn)生圖像特征金字塔;
所述圖像特征金字塔包括邊界特征金字塔、圖像分類特征金字塔和圖像噪聲特征金字塔;
S60、將所述圖像分類特征金字塔和圖像噪聲特征金字塔輸入所述ROI?Align雙線性池化網(wǎng)絡(luò);
S70、所述邊界特征金字塔輸入所述RPN區(qū)域提議網(wǎng)絡(luò)產(chǎn)生圖像篡改候選區(qū)域特征,并輸入所述ROI?Align雙線性池化網(wǎng)絡(luò);
S80、所述ROI?Align雙線性池化網(wǎng)絡(luò)對輸入的所述圖像分類特征、圖像噪聲特征和所述圖像篡改候選區(qū)域特征進(jìn)行特征合并,并輸出所述篡改圖像的分類、篡改區(qū)域定位和圖像分割結(jié)果;
S90、使用數(shù)據(jù)集對圖像篡改檢測神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、測試;所述數(shù)據(jù)集為基于PASCAL?VOC數(shù)據(jù)集合成創(chuàng)建了新的篡改數(shù)據(jù)集(PASCAL?VOC-TP);所述新的篡改數(shù)據(jù)集(PASCAL?VOC-TP)包括篡改圖像、篡改區(qū)域坐標(biāo)值和篡改區(qū)域的掩碼值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽大學(xué),未經(jīng)安徽大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122303.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像語義標(biāo)注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測
- 針對深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機(jī)設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時空特征學(xué)習(xí)與情感分類方法
- 一種基于FPGA的深度學(xué)習(xí)加速方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





