[發明專利]用于確定相似圖片的方法和裝置在審
| 申請號: | 201811495715.3 | 申請日: | 2018-12-07 |
| 公開(公告)號: | CN111291765A | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 張超 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 確定 相似 圖片 方法 裝置 | ||
本申請實施例公開了用于確定相似圖片的方法和裝置。該方法的一具體實施方式包括:將目標圖片輸入已訓練的圖像相似度評價模型中的特征提取網絡進行圖像特征提取,得到目標圖片的特征向量;基于目標圖片的特征向量以及預先獲取的候選圖片集合的特征矩陣,從候選圖片集合中確定出目標圖片的相似圖片;其中,候選圖片集合的特征矩陣由候選圖片集合中各候選圖片的特征向量構建,候選圖片的特征向量基于已訓練的圖像相似度評價模型中的特征提取網絡對候選圖片進行特征提取得出。該實施方式提升了相似圖片查找的準確率和效率。
技術領域
本申請實施例涉及計算機技術領域,具體涉及圖像處理技術領域,尤其涉及用于確定相似圖片的方法和裝置。
背景技術
隨著網絡技術的發展,產生了越來越多的互聯網數據。搜索引擎可以對海量的互聯網數據進行搜集和整理,用戶可以通過基于爬蟲技術的搜索引擎輸入關鍵描述信息獲取數據內容。常用的關鍵描述信息是文本關鍵詞,在搜索時可以利用文本關鍵詞做匹配。
在一些平臺中,數據內容的描述方式是多樣化的,例如電商平臺中數據內容大多是基于圖片結合文字描述的。采用傳統的文本關鍵字的檢索方法在這些平臺中得到的檢索結果數據量較大,需要依靠人工二次篩選。并且,在一些場景中,用戶希望查看已知數據內容的相似內容,可以利用后臺搜索引擎預先對網絡中的數據內容進行抓取并根據數據內容的文字描述信息所構建的索引來查找相似內容,這種內容查找方式對后臺搜索引擎的數據索引模式具有很強的依賴性。
發明內容
本申請實施例提出了用于確定相似圖片的方法和裝置。
第一方面,本申請實施例提供了一種用于確定相似圖片的方法,包括:將目標圖片輸入已訓練的圖像相似度評價模型中的特征提取網絡進行圖像特征提取,得到目標圖片的特征向量;基于目標圖片的特征向量以及預先獲取的候選圖片集合的特征矩陣,從候選圖片集合中確定出目標圖片的相似圖片;其中,候選圖片集合的特征矩陣由候選圖片集合中各候選圖片的特征向量構建,候選圖片的特征向量基于已訓練的圖像相似度評價模型中的特征提取網絡對候選圖片進行特征提取得出。
在一些實施例中,上述候選圖片的特征向量為歸一化的行特征向量,目標圖片的特征向量為歸一化的列特征向量;上述候選圖片集合的特征矩陣中,每幅候選圖片的特征向量為特征矩陣中的一個行向量;上述基于目標圖片的特征向量以及預先獲取的候選圖片集合的特征矩陣,從候選圖片集合中確定出目標圖片的相似圖片,包括:確定特征矩陣與目標圖片的特征向量相乘得到的結果列向量中的元素的最大值,確定特征矩陣中對應于最大值在結果列向量中的位置的特征向量所表征的候選圖片為目標圖片的相似圖片。
在一些實施例中,上述候選圖片的特征向量為歸一化的列特征向量,目標圖片的特征向量為歸一化的行特征向量;上述候選圖片集合的特征矩陣中,每幅候選圖片的特征向量為特征矩陣中的一個列向量;上述基于目標圖片的特征向量以及預先獲取的候選圖片集合的特征矩陣,從候選圖片集合中確定出目標圖片的相似圖片,包括:確定目標圖片的特征向量與特征矩陣相乘得到的結果行向量中的元素的最大值,確定特征矩陣中對應于最大值在結果行向量中的位置的特征向量所表征的候選圖片為目標圖片的相似圖片。
在一些實施例中,上述圖像相似度評價模型包括相似度計算網絡以及兩個共享權重的特征提取網絡;上述方法還包括:基于由候選圖片構建的樣本圖片對集合訓練得出已訓練的圖像相似度評價模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811495715.3/2.html,轉載請聲明來源鉆瓜專利網。





