[發(fā)明專利]圖片的重復(fù)檢測方法、裝置、計算機設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010525800.0 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN113780316A | 公開(公告)日: | 2021-12-10 |
| 發(fā)明(設(shè)計)人: | 向燕 | 申請(專利權(quán))人: | 蘇寧云計算有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210000 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖片 重復(fù) 檢測 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種圖片重復(fù)檢測方法、裝置、計算機設(shè)備和存儲介質(zhì)。方法包括:接收原始圖片與待檢測圖片,對原始圖片和任一待檢測圖片組成的圖像組進行第一重復(fù)檢測;接收第一檢測結(jié)果,對判定為重復(fù)的上述圖像組進行第二重復(fù)檢測;接收第二檢測結(jié)果,根據(jù)第二檢測結(jié)果,確定重復(fù)圖片。本發(fā)明可以有效的解決相同背景下針對商品主體細節(jié)特征進行圖片重復(fù)檢測的問題,顯著地提高了檢測結(jié)果的準(zhǔn)確率,可以有效的提升后續(xù)高層次的圖像處理任務(wù)的效果。
技術(shù)領(lǐng)域
本申請涉及圖片審核技術(shù)領(lǐng)域,特別是涉及一種圖片重復(fù)檢測方法、裝置、計算機設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著多媒體技術(shù)和互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)上的圖像數(shù)量呈爆炸式增長。同文字信息相比,基于視覺的圖像更加生動、易于理解,這種優(yōu)勢使得數(shù)字圖像的應(yīng)用范圍非常廣泛,在數(shù)字圖像帶來信息傳播的便利的同時,互聯(lián)網(wǎng)上的圖像通常呈現(xiàn)這樣一種特征:通過使用圖像搜索引擎,會發(fā)現(xiàn)一幅原始的數(shù)字圖像經(jīng)常會有很多重復(fù)的圖像。這種現(xiàn)象造成了互聯(lián)網(wǎng)資源的巨大浪費,同時也帶來了圖像侵權(quán)等問題。因此,高效的重復(fù)圖像檢測算法就顯得尤為重要。為了解決這個問題,現(xiàn)有圖像處理領(lǐng)域的常規(guī)做法是基于直方圖匹配、基于互信息以及基于哈希指紋等圖像重復(fù)檢測算法。
基于直方圖匹配的方法,只能捕捉顏色信息的相似性,沒有利用圖片的結(jié)構(gòu)、紋理特征等信息,檢測精度較低?;诨バ畔⒌姆椒?,在兩張圖片大小一致時,可在一定程度上表征重復(fù)程度,然而當(dāng)圖片大小不一致時,互信息損失較多,不能進行有效的重復(fù)圖片檢測?;诰倒5膱D像重復(fù)檢測算法主要計算圖片的低頻成分,圖片主體細節(jié)特征在頻譜中主要表現(xiàn)為高頻信息,均值哈希方法對高頻信息的檢測精度較低,因此對于相同背景下圖片主體細節(jié)不同的重復(fù)檢測效果不理想。基于光流LK的算法通常用于檢測視頻的抖動,其應(yīng)用條件需要滿足亮度恒定、小運動和空間一致的三個假設(shè)條件,以上條件顯示出該方法對圖片低頻信息檢測的敏感度較低,無法單獨應(yīng)用于圖像重復(fù)檢測的應(yīng)用場景。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提出了,
一種圖片重復(fù)檢測方法,所述方法包括:
接收原始圖片與待檢測圖片,對原始圖片和任一待檢測圖片組成的圖像組進行第一重復(fù)檢測;
接收第一檢測結(jié)果,對判定為重復(fù)的上述圖像組進行第二重復(fù)檢測;
接收第二檢測結(jié)果,根據(jù)第二檢測結(jié)果,確定重復(fù)圖片。
在一個實施例中,原始圖片和待檢測圖片都包括低頻成分和高頻成分,第一重復(fù)檢測通過比較低頻成分的圖片信息來判斷圖片是否重復(fù)。
在一個實施例中,對圖像組進行第一重復(fù)檢測包括:
調(diào)整圖像組中的圖片大小,統(tǒng)一設(shè)置為預(yù)設(shè)尺寸;
將上述調(diào)整過的圖片轉(zhuǎn)化為灰度圖像;
計算每個灰度圖像上的所有像素的灰度平均值;
分別比較每個像素的灰度值與灰度平均值的大小,若像素的灰度值不小于灰度平均值,則記為1,否則記為0,組合比較結(jié)果形成圖像組中圖片的哈希指紋;
分別計算原始圖片和待檢測圖片的哈希指紋的漢明距離,漢明距離小于預(yù)設(shè)閾值,判定上述圖像組為重復(fù)圖片,得到第一檢測結(jié)果。
在一個實施例中,預(yù)設(shè)尺寸為8x8像素,每張圖片包括64個像素點。
在一個實施例中,選取原始圖片的第一特征點,以及待檢測圖片的與原始圖片的第一特征點對應(yīng)的第二特征點,第二重復(fù)檢測通過對圖像組的所有對應(yīng)的特征點進行重復(fù)度檢測,確定第二檢測結(jié)果。
在一個實施例中,計算所有特征點的光流向量和變換矩陣,根據(jù)光流向量的平均幅值和角度方差,以及變換矩陣的偏移量信息,檢測上述圖像組中的原始圖片和待檢測圖片的重復(fù)度,確定第二檢測結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇寧云計算有限公司,未經(jīng)蘇寧云計算有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010525800.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





