[發明專利]搜索相似圖片的方法及系統在審
| 申請號: | 202010984382.1 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112148909A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 張景鵬 | 申請(專利權)人: | 微夢創科網絡科技(中國)有限公司 |
| 主分類號: | G06F16/535 | 分類號: | G06F16/535;G06F16/538;G06F16/55;G06N3/04;G06N3/08 |
| 代理公司: | 北京卓嵐智財知識產權代理事務所(特殊普通合伙) 11624 | 代理人: | 郭智 |
| 地址: | 100193 北京市海淀區東北旺西路中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 相似 圖片 方法 系統 | ||
1.一種搜索相似圖片的方法,其特征在于,所述方法包括:
將各圖片輸入至分類器,得到每張圖片的特征向量和分屬不同類別的概率;
根據各圖片分屬不同類別的概率,從各類別中為每張圖片匹配備選類別;
搜索備選類別與目標圖片備選類別之間滿足預定條件的圖片,作為目標圖片的備選圖片;
選取特征向量與目標圖片特征向量的距離小于預設距離閾值的備選圖片,作為目標圖片的相似圖片。
2.根據權利要求1所述的搜索相似圖片的方法,其特征在于,所述根據各圖片分屬不同類別的概率,從各類別中為每張圖片匹配備選類別,具體包括:
針對當前圖片:
將該圖片分屬不同類別的概率進行降序排列;
選取前N個概率對應的類別作為該圖片的備選類別,其中,N≥1。
3.根據權利要求2所述的搜索相似圖片的方法,其特征在于,所述將各圖片輸入至分類器之前,還包括:
將分類器進行訓練;
所述從各類別中為每張圖片匹配備選類別之后,還包括:
根據每張圖片的備選類別,將各圖片存儲至數據庫中。
4.根據權利要求3所述的搜索相似圖片的方法,其特征在于,所述根據每張圖片的備選類別,將各圖片存儲至數據庫中,具體包括:
針對當前圖片:
將該圖片的各備選類別的名稱按照對應的概率降序排列的順序拼接成備選標識;
將該圖片存儲至非關系型分布式數據庫HBase中,將備選標識作為該圖片的行鍵,在行鍵對應的列值中存入該圖片的特征向量和圖片ID。
5.根據權利要求4所述的搜索相似圖片的方法,其特征在于,所述搜索備選類別與目標圖片備選類別之間滿足預定條件的圖片,作為目標圖片的備選圖片,具體包括:
當N=1,或者,N>1且目標圖片備選類別中順序相鄰的類別對應的概率之間的差值大于預設概率閾值時:
搜索各圖片的行鍵,確定與目標圖片的行鍵相同的圖片ID;
根據確定出的圖片ID,獲取對應圖片作為目標圖片的備選圖片;
當N>1,且目標圖片備選類別中順序相鄰的類別對應的概率之間的差值小于等于預設概率閾值時:
將目標圖片備選類別的名稱修改順序拼接成改序標識;
用目標圖片的改序標識更新對應的行鍵;
搜索各圖片的行鍵,分別確定與目標圖片更新前的行鍵相同的圖片ID,以及與目標圖片更新后的行鍵相同的圖片ID;
根據確定出的圖片ID,獲取對應圖片作為目標圖片的備選圖片。
6.根據權利要求4所述的搜索相似圖片的方法,其特征在于,所述選取特征向量與目標圖片特征向量的距離小于預設距離閾值的備選圖片,作為目標圖片的相似圖片,具體包括:
根據目標圖片的各備選圖片的圖片ID,獲取對應的特征向量;
分別計算每張備選圖片的特征向量與目標圖片特征向量的距離;
將所述距離小于預設距離閾值的備選圖片作為目標圖片的相似圖片。
7.一種搜索相似圖片的系統,其特征在于,所述系統包括:
分類器,用于將各圖片輸入后,得到每張圖片的特征向量和分屬不同類別的概率;
匹配單元,用于根據各圖片分屬不同類別的概率,從各類別中為每張圖片匹配備選類別;
搜索單元,用于搜索備選類別與目標圖片備選類別之間滿足預定條件的圖片,作為目標圖片的備選圖片;
選取單元,用于選取特征向量與目標圖片特征向量的距離小于預設距離閾值的備選圖片,作為目標圖片的相似圖片。
8.根據權利要求7所述的搜索相似圖片的系統,其特征在于,所述匹配單元,具體用于:
針對當前圖片:
將該圖片分屬不同類別的概率進行降序排列;
選取前N個概率對應的類別作為該圖片的備選類別,其中,N≥1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微夢創科網絡科技(中國)有限公司,未經微夢創科網絡科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010984382.1/1.html,轉載請聲明來源鉆瓜專利網。





