[發明專利]興趣點識別方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202010928443.2 | 申請日: | 2020-09-07 |
| 公開(公告)號: | CN112101165B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 岳大威;王宇 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V20/62;G06K9/62;G06F16/29;G06N3/04;G06N3/08;G06V10/80 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 李文淵 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 興趣 識別 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及計算機視覺的一種興趣點識別方法、裝置、計算機設備和存儲介質。所述方法包括:獲取待處理圖像;識別所述待處理圖像中的文本區域;對所述文本區域對應的圖像進行圖像特征提取,獲得圖像特征;對所述文本區域中的文本內容進行文本特征提取,獲得文本特征;提取所述文本區域在所述待處理圖像中對應的空間位置特征;將圖像特征、文本特征和空間位置特征融合,根據融合后的特征對所述文本區域進行興趣點識別。采用本方法能夠能夠精準有效地識別出圖像中的興趣點信息。
技術領域
本申請涉及計算機技術領域,特別是涉及一種興趣點識別方法、裝置、計算機設備和存儲介質。
背景技術
在地理信息系統中,POI(Point of Information,信息點)也稱為興趣點,一個POI可以是一棟房子、一個商鋪、一個郵筒、一個公交站、一個公司、一所學校等等。POI可以用于對電子地圖場景中的事物或事件的位置進行描述,從而增強對事物或事件位置的描述能力和查詢能力。隨著互聯網技術和人工智能等技術的迅速發展,POI信息在互聯網地圖等領域中起到了重要的作用。例如,通過POI信息,用戶可以在地圖中方便地找到感興趣的地點以及到達該地點的路線。
然而目前的方式中,通常是通過人工手動標注出POI信息。這種方式需要花費大量的人力,成本較高,且效率較低。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠精準有效地識別出圖像中的興趣點信息的興趣點識別方法、裝置、計算機設備和存儲介質。
一種興趣點識別方法,所述方法包括:
獲取待處理圖像;
識別所述待處理圖像中的文本區域;
對所述文本區域對應的圖像進行圖像特征提取,獲得圖像特征;
對所述文本區域中的文本內容進行文本特征提取,獲得文本特征;
提取所述文本區域在所述待處理圖像中對應的空間位置特征;
將所述圖像特征、所述文本特征和所述空間位置特征融合,根據融合后的特征對所述文本區域進行興趣點識別。
一種興趣點識別裝置,所述裝置包括:
數據獲取模塊,用于獲取待處理圖像;識別所述待處理圖像中的文本區域;
圖像特征提取模塊,用于對所述文本區域對應的圖像進行圖像特征提取,獲得圖像特征;
文本特征提取模塊,用于對所述文本區域中的文本內容進行文本特征提取,獲得文本特征;
空間特征提取模塊,用于提取所述文本區域在所述待處理圖像中對應的空間位置特征;
興趣點識別模塊,用于將所述圖像特征、所述文本特征和所述空間位置特征融合,根據融合后的特征對所述文本區域進行興趣點識別。
在其中一個實施例中,所述數據獲取模塊還用于對所述待處理圖像進行文本檢測,識別所述待處理圖像中的文本行的位置;根據所述文本行的位置,標記所述待處理圖像中的文本框,根據所述文本框確定所述待處理圖像中的文本區域。
在其中一個實施例中,所述圖像特征提取模塊還用于通過預先訓練的機器學習模型中的圖像特征提取層,按照預設尺寸對所述文本區域所對應的圖像的區域進行調整,得到區域調整后的圖像;提取所述區域調整后的圖像對應的特征圖;對所述特征圖進行多尺度特征提取,得到圖像特征。
在其中一個實施例中,所述圖像特征提取模塊還用于對所述特征圖進行全局特征提取,獲得全局特征;將所述特征圖和所述全局特征進行特征融合,獲得融合圖特征;對所述融合圖特征進行多尺度特征提取,得到圖像特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010928443.2/2.html,轉載請聲明來源鉆瓜專利網。





