[發(fā)明專利]一種基于SIFT算法的重圖檢測方法在審
| 申請?zhí)枺?/td> | 201710653168.6 | 申請日: | 2017-08-02 |
| 公開(公告)號: | CN107392215A | 公開(公告)日: | 2017-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 鐘力;吳海龍 | 申請(專利權(quán))人: | 焦點(diǎn)科技股份有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙)32249 | 代理人: | 陳建和 |
| 地址: | 210003 江蘇省南京市高新*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 sift 算法 檢測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像檢測領(lǐng)域,具體而言,涉及一種基于SIFT算法的對電子商務(wù)網(wǎng)站重復(fù)圖片進(jìn)行檢測的方法。
背景技術(shù)
在競爭日趨激烈的商品市場中,一些電子商務(wù)網(wǎng)站(如中國制造網(wǎng)等)的商家為了達(dá)到增加產(chǎn)品流量及銷量的目的,重復(fù)提交相同的產(chǎn)品,即重復(fù)鋪貨。通常,電子商務(wù)網(wǎng)站會限制商家重復(fù)鋪貨的行為,通常網(wǎng)站對于重復(fù)鋪貨有如下定義:完全相同以及商品的重要屬性完全相同的商品,只允許使用一種出售方式,發(fā)布一次。違反以上規(guī)則,即可判定為重復(fù)發(fā)布;對于不同的商品,必須在商品的標(biāo)題、描述、圖片等方面體現(xiàn)商品的不同,否則將被判定為重復(fù)鋪貨。一般對對于重復(fù)商品的檢測:第一,品牌型號不能一樣;第二,標(biāo)題、商品描述不能一樣;第三,圖片不能一樣。
其中對于重復(fù)圖片的判定是一個技術(shù)難點(diǎn),以中國制造網(wǎng)為例,重復(fù)鋪貨的商家為了避開網(wǎng)站的檢測,通常上傳的重復(fù)圖片并非完全一致,而是對其進(jìn)行了如圖片縮放、取局部、模糊、打水印等處理。為了應(yīng)對電商網(wǎng)站比較復(fù)雜的圖片環(huán)境,以往對于重復(fù)圖片的判定通常由業(yè)務(wù)人員人工檢測,但隨著網(wǎng)站流量的提升以及商品的大量新增,人工檢測的方法勢必會耗費(fèi)大量的人工成本。現(xiàn)有的sift是圖像匹配的經(jīng)典的算法,SIFT算法的匹配(Scale-invariant feature transform,尺度不變特征轉(zhuǎn)換)是一種電腦視覺的算法用來偵測與描述影像中的局部性特征,它在空間尺度中尋找極值點(diǎn),并提取出其位置、尺度、旋轉(zhuǎn)不變量,此算法由David Lowe在1999年所發(fā)表,2004年完善總結(jié)。目前應(yīng)用范圍包含物體辨識、機(jī)器人地圖感知與導(dǎo)航、影像縫合、3D模型建立、手勢辨識、影像追蹤和動作比對。
發(fā)明內(nèi)容
本發(fā)明目的是,給定重復(fù)圖片的相似度判定區(qū)間,最終達(dá)到自動化識別重圖的效果,進(jìn)而為判定商家是否重復(fù)鋪貨提供依據(jù)。使得電子商務(wù)網(wǎng)站的運(yùn)行良好,給網(wǎng)站瀏覽受眾給出清新不重復(fù)的環(huán)境。
本發(fā)明的技術(shù)方案是:一種基于SIFT算法的電商網(wǎng)站重復(fù)圖片檢測的自動化方法,具體內(nèi)容包括:
1、圖像截圖處理
因?yàn)椴糠种袊圃炀W(wǎng)商家會在其產(chǎn)品圖片上下兩端加上文字與logo,因此在應(yīng)用SIFT之前需要先進(jìn)行圖像預(yù)處理。
2、構(gòu)建尺度空間
通過對圖像進(jìn)行尺度變換,獲得圖像多尺度下的尺度空間表示序列,并搜索所有尺度上的圖像位置。通常通過高斯微分函數(shù)來識別潛在的對于尺度和旋轉(zhuǎn)不變的關(guān)鍵點(diǎn)。
3、關(guān)鍵點(diǎn)定位
在每個候選的位置上,通過一個擬合精細(xì)的模型來確定位置和尺度。關(guān)鍵點(diǎn)的選擇依據(jù)于它們的穩(wěn)定程度。
4、關(guān)鍵點(diǎn)方向確定
基于圖像局部的梯度方向,分配給每個關(guān)鍵點(diǎn)位置一個或多個方向。所有后面的對圖像數(shù)據(jù)的操作都相對于關(guān)鍵點(diǎn)的方向、尺度和位置進(jìn)行變換,從而提供對于這些變換的不變性。
5、關(guān)鍵點(diǎn)描述
在每個關(guān)鍵點(diǎn)周圍的鄰域內(nèi),在選定的尺度上測量圖像局部的梯度。這些梯度被變換成一種表示,這種表示允許比較大的局部形狀的變形和光照變化。
6、關(guān)鍵點(diǎn)匹配
通過兩圖中的描述器的兩兩比較找出相互匹配的若干對特征點(diǎn),也就建立了圖片間的對應(yīng)關(guān)系。
7、相似度計(jì)算
通過自定義圖片相似度計(jì)算公式,并通過給定的重復(fù)圖片的相似度判定區(qū)間,判斷是否為重復(fù)圖片。
有益效果,本發(fā)明充分利用SIFT算法的局部影像特征的描述與偵測可以幫助辨識物體,SIFT特征是基于物體上的一些局部外觀的興趣點(diǎn)而與影像的大小和旋轉(zhuǎn)無關(guān)。對于光線、噪聲、些微視角改變的容忍度也相當(dāng)高。特性高度顯著而且相對容易提取,在母數(shù)龐大的特征數(shù)據(jù)庫中,很容易辨識物體而且誤認(rèn)低。使用SIFT特征描述對于部分物體遮蔽的偵測率也相當(dāng)高,甚至只需要3個以上的SIFT物體特征就足以計(jì)算出位置與方位。在今天的特征數(shù)據(jù)庫條件下,辨識速度可接近即時運(yùn)算。SIFT特征的信息量大,適合在海量數(shù)據(jù)庫中快速準(zhǔn)確匹配。本發(fā)明就是通過對圖片的相似度進(jìn)行定量計(jì)算,并以中國制造網(wǎng)為例,通過對大量相似圖片的計(jì)算,給定重復(fù)圖片的相似度判定區(qū)間,最終達(dá)到自動化識別重圖的效果,進(jìn)而為判定商家是否重復(fù)鋪貨提供依據(jù)。給商業(yè)網(wǎng)站提供一實(shí)用工具。
附圖說明
圖1為本發(fā)明實(shí)施例的流程圖;
圖2為本發(fā)明圖像的高斯金字塔模型的示意圖;
圖3為本發(fā)明DOG算子構(gòu)建DOG金字塔示意圖。
圖4至圖7是本發(fā)明的效果圖;每個圖中均有四個實(shí)施例,每個實(shí)施例對應(yīng)一個具體查重的結(jié)果。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于焦點(diǎn)科技股份有限公司,未經(jīng)焦點(diǎn)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710653168.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





