[發明專利]圖片搜題耗時優化的方法、裝置、電子設備和存儲介質在審
| 申請號: | 202010554816.4 | 申請日: | 2020-06-17 |
| 公開(公告)號: | CN111708903A | 公開(公告)日: | 2020-09-25 |
| 發明(設計)人: | 趙華;史云奇 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G06F16/532 | 分類號: | G06F16/532;G06F16/55;G06K9/20;G06K9/32 |
| 代理公司: | 廣州智斧知識產權代理事務所(普通合伙) 44649 | 代理人: | 孔德超 |
| 地址: | 528850 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 耗時 優化 方法 裝置 電子設備 存儲 介質 | ||
1.一種圖片搜題耗時優化的方法,其特征在于,包括:
獲取目標圖片;
在接收到搜題指令時,獲取所述目標圖片所占內存的大小,在所述目標圖片所占內存的大小大于或等于預設閾值時,對所述目標圖片按照預定壓縮率進行壓縮,得到壓縮圖片;
采用所述壓縮圖片進行搜題。
2.根據權利要求1所述的方法,其特征在于,在所述獲取目標圖片之前,還包括:
通過訓練樣本集根據預定搜題正確率確定預定壓縮率。
3.根據權利要求2所述的方法,其特征在于,所述通過訓練樣本集根據預定搜題正確率確定預定壓縮率,包括:
對訓練樣本集中每個樣本均通過不同壓縮率進行壓縮,得到壓縮樣本;
確定每個壓縮率下壓縮樣本的文字識別率;
在所述文字識別率等于文字識別率閾值時,確定所述預定壓縮率,所述預定壓縮率為等于文字識別率閾值的壓縮樣本對應的壓縮率。
4.根據權利要求3所述的方法,其特征在于,所述文字識別率閾值確定的方法,包括:
構建文字識別率和搜題準確率的線性函數;
根據預設搜題準確率以及所述線性函數確定文字識別率閾值。
5.根據權利要求3所述的方法,其特征在于,在所述文字識別率等于文字識別率閾值時,確定所述預定壓縮率,包括:
確定每個壓縮樣本的文字識別率等于文字識別率閾值時的目標壓縮率;
對所有目標壓縮率進行聚類,并確定目標聚類集合,所述目標聚類集合為聚類中數量最大的目標壓縮率的集合;
獲取目標聚類集合中所有目標壓縮率的平均值,并將所述平均值作為預定壓縮率。
6.根據權利要求1-5任一項所述的方法,其特征在于,采用所述壓縮圖片進行搜題,包括:
對所述壓縮圖片進行OCR識別,得到文字識別信息;
利用所述文字識別信息在資源庫或互聯網中按照搜題指令進行搜索,得到搜題結果。
7.根據權利要求1-5任一項所述的方法,其特征在于,所述預定壓縮率包括尺寸壓縮率或/和質量壓縮率。
8.一種圖片搜題耗時優化的裝置,其特征在于,包括:
獲取單元,用于獲取目標圖片;
壓縮單元,用于在接收到搜題指令時,獲取所述目標圖片所占內存的大小,在所述目標圖片所占內存的大小大于或等于預設閾值時,對所述目標圖片按照預定壓縮率進行壓縮,得到壓縮圖片;
搜題單元,用于采用所述壓縮圖片進行搜題。
9.根據權利要求8所述的裝置,其特征在于,所述裝置,還包括:
訓練單元,用于通過訓練樣本集根據預定搜題正確率確定預定壓縮率。
10.根據權利要求9所述的裝置,其特征在于,所述訓練單元,包括:
模型構建子單元,用于對訓練樣本集中每個樣本均通過不同壓縮率進行壓縮,得到壓縮樣本;
識別率確定子單元,用于確定每個壓縮率下壓縮樣本的文字識別率;
壓縮率確定子單元,用于在所述文字識別率等于文字識別率閾值時,確定所述預定壓縮率,所述預定壓縮率為等于文字識別率閾值的壓縮樣本對應的壓縮率。
11.根據權利要求10所述的裝置,其特征在于,所述識別率確定子單元,包括:
第一孫單元,用于構建文字識別率和搜題準確率的線性函數;
第二孫單元,用于根據預設搜題準確率以及所述線性函數確定文字識別率閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010554816.4/1.html,轉載請聲明來源鉆瓜專利網。





