[發明專利]一種敏感圖片搜索方法和裝置在審
| 申請號: | 201310226529.0 | 申請日: | 2013-06-07 |
| 公開(公告)號: | CN103294813A | 公開(公告)日: | 2013-09-11 |
| 發明(設計)人: | 方偉;蘇鵬宇 | 申請(專利權)人: | 北京捷成世紀科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/46 |
| 代理公司: | 北京慶峰財智知識產權代理事務所(普通合伙) 11417 | 代理人: | 劉元霞 |
| 地址: | 100191 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 敏感 圖片 搜索 方法 裝置 | ||
1.一種敏感圖片的搜索方法,其特征在于,包括如下步驟:
提取待查詢圖片上的局部特征向量集合并將圖片生成為特征向量;
根據特征向量查找既定敏感圖片庫的倒排索引,得到與查詢圖片相關的各敏感圖片;
計算待查詢圖片與各敏感圖片之間的相似度,并按相似度對各敏感圖片進行初排序;
利用圖片特征點對初排序得到的各敏感圖片進行篩選,如得到返回的結果圖片為敏感圖片,則報警。
2.根據權利要求1所述的方法,其特征在于:所述倒排索引建立包括:
對每張敏感圖片進行局部特征點檢測并提取出每個特征點空間鄰域區域上的特征向量;然后對所有特征向量進行聚類,生成的聚類中心分別對應視覺詞,從而構成視覺詞典;
用所述視覺詞典對敏感圖片庫中的所有敏感圖片進行量化,形成倒排索引。
3.根據權利要求2所述的方法,其特征在于:所述用所述視覺詞典對敏感圖片庫中的所有敏感圖片進行量化時,
精簡視覺詞典,即對所有聚類中心下的特征向量個數進行統計和排序,將類中特征向量個數排在前T%的區分能力較弱的視覺詞刪除掉,其中T為預設閾值,其值根據生成視覺詞典的視覺詞分布結果來選取;
采用比值法來對所述特征向量量化到精簡后的視覺詞典中的視覺詞進行評價;一個特征向量能夠被量化為對應的視覺詞,當且僅當所述特征向量在視覺詞詞典中進行2近鄰查找時,返回的兩個視覺詞與所述特征向量之間的距離或相似度的比值Ratiodist,滿足如下條件:
其中,和分別表示特征向量在視覺詞典中查找返回的最近鄰和次近鄰視覺詞;Dist<feature,和Dist<feature,分別表示所述特征向量feature與其最近鄰視覺詞和次近鄰視覺詞之間的距離值;Tratio(0<Tratio≤1)是一個預設的閾值,其值由生成視覺詞典階段統計正確量化結果而得。
4.根據權利要求2所述的方法,其特征在于:所述視覺詞為一個高維向量,采用近似K-means方法來進行聚類。
5.根據權利要求1所述的方法,其特征在于:所述計算待查詢圖片與各敏感圖片之間的相似度時,采用加權直方圖相交方法來衡量圖片之間的相似度;將兩張圖片的BOW特征向量進行歸一化,對兩個BOW特征向量進行IDF加權,對加權后的兩個特征向量進行直方圖相交運算,得到兩張圖片的相似度。
6.根據權利要求1所述的方法,其特征在于:所述對初排序得到的各敏感圖片進行篩選時,利用圖像特征點之間的局部分布關系以及全局幾何約束條件來刪除錯誤匹配的特征點對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京捷成世紀科技股份有限公司,未經北京捷成世紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310226529.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:影像文件搜索系統及方法
- 下一篇:千萬千瓦級風電基地風機運行信息實時監測方法





