[發明專利]圖片搜索方法、裝置、設備及計算機程序產品在審
| 申請號: | 202011248141.7 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112347948A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 杜瑋 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06F16/583 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 劉星雨;張穎玲 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 搜索 方法 裝置 設備 計算機 程序 產品 | ||
本申請實施例提供一種圖片搜索方法、裝置、設備及計算機程序產品,涉及人工智能技術領域。方法包括:響應于圖片搜索請求,獲取預設圖片庫中每一圖片的OCR識別結果;遍歷未完成低維OCR識別處理、且未完成高維OCR識別處理的圖片,并對遍歷到的每一圖片進行基于OCR識別閾值的低維OCR識別處理,得到每一對應圖片的低維OCR識別結果;根據每一圖片的低維OCR識別結果或高維OCR識別結果,在預設圖片庫中確定與關鍵詞匹配的目標圖片;將目標圖片確定為圖片搜索請求的搜索結果,并顯示搜索結果。通過本申請實施例,能夠更準確的搜索圖片中的文字信息,實現精細化的搜索,得到準確的搜索結果,并且能夠提高搜索效率。
技術領域
本申請實施例涉及互聯網技術領域,涉及但不限于一種圖片搜索方法、裝置、設備及計算機程序產品。
背景技術
相關技術中,基于光學字符識別(OCR,Optical Character Recognition)的圖片搜索是依靠OCR識別圖片上的文字,再進行搜索。在圖片數量很多時,用戶可能需要等待OCR全量識別完成后才能得到搜索結果,時間成本上相對較高,另外如果需要對圖片中更細節的文字信息進行搜索,如對圖片中的筆記信息、店鋪店名的搜索,這時候原有的搜索功能并不能提供這種精細化的搜索。
發明內容
本申請實施例提供一種圖片搜索方法、裝置、設備及計算機程序產品,涉及人工智能技術領域。由于同時結合低維OCR識別處理和高維OCR識別處理的識別結果進行圖片搜索,能夠更準確的搜索圖片中的文字信息,實現精細化的搜索,得到準確的搜索結果,并且能夠提高搜索效率。
本申請實施例的技術方案是這樣實現的:
本申請實施例提供一種圖片搜索方法,包括:
獲取圖片搜索請求,所述圖片搜索請求中包括關鍵詞;
響應于所述圖片搜索請求,獲取預設圖片庫中每一圖片的OCR識別結果;其中,所述OCR識別結果包括以下至少之一:采用基于OCR識別閾值的低維OCR識別處理所得到的低維OCR識別結果、和基于深度識別的高維OCR識別處理所得到的高維OCR識別結果,所述低維OCR識別處理的識別精度小于所述高維OCR識別處理的識別精度;
遍歷未完成所述低維OCR識別處理、且未完成所述高維OCR識別處理的圖片,并對遍歷到的每一圖片進行所述低維OCR識別處理,得到每一對應圖片的低維OCR識別結果;
根據每一圖片的所述低維OCR識別結果或所述高維OCR識別結果,在所述預設圖片庫中確定與所述關鍵詞匹配的目標圖片;
將所述目標圖片確定為所述圖片搜索請求的搜索結果,并顯示所述搜索結果。
在一些實施例中,其特征在于,所述方法還包括:
確定每一所述圖片的低維OCR識別結果對應的可信度;
刪除可信度低于閾值的低維OCR識別結果。
本申請實施例提供一種圖片搜索裝置,包括:
獲取模塊,用于獲取圖片搜索請求,所述圖片搜索請求中包括關鍵詞;
響應模塊,用于響應于所述圖片搜索請求,獲取預設圖片庫中每一圖片的OCR識別結果;其中,所述OCR識別結果包括以下至少之一:采用基于OCR識別閾值的低維OCR識別處理所得到的低維OCR識別結果、和基于深度識別的高維OCR識別處理所得到的高維OCR識別結果,所述低維OCR識別處理的識別精度小于所述高維OCR識別處理的識別精度;
處理模塊,用于遍歷未完成所述低維OCR識別處理、且未完成所述高維OCR識別處理的圖片,并對遍歷到的每一圖片進行所述低維OCR識別處理,得到每一對應圖片的低維OCR識別結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011248141.7/2.html,轉載請聲明來源鉆瓜專利網。





