[發明專利]一種基于注意力機制圖像檢索的LOGO識別方法在審
| 申請號: | 202010558069.1 | 申請日: | 2020-06-18 |
| 公開(公告)號: | CN111881906A | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 張容琛 | 申請(專利權)人: | 廣州萬維創新科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06K9/62;G06F17/14;G06F17/16;G06N3/04 |
| 代理公司: | 廣州致信偉盛知識產權代理有限公司 44253 | 代理人: | 李東來 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 圖像 檢索 logo 識別 方法 | ||
1.一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,包括以下步驟:
步驟S1:獲取圖像中包含LOGO的區域;
步驟S2:將圖像中包含LOGO的區域進行截取,由特征提取網絡獲取包含LOGO區域的特征張量;
步驟S3:將包含LOGO區域的特征張量進行特征壓縮得到特征向量;
步驟S4:將包含LOGO區域的特征向量與圖像庫中LOGO的特征向量進行特征空間距離運算,選擇距離最短的圖像作為匹配到的LOGO;
步驟S5:讀取匹配到的LOGO的特征編碼對應的標簽,將匹配LOGO的標簽作為待識別LOGO的標簽,完成LOGO識別。
2.根據權利要求1所述一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,所述步驟S1,包括以下步驟:
步驟S1-1:獲取包含LOGO的區域的圖像數據;
步驟S1-2:將圖像數據通過全卷積FCN結構建立圖像數據模型;
步驟S1-3:圖像數據模型通過殘差跳層連接的方式將多尺度的淺層圖像特征和高層語義特征進行融合;
步驟S1-4:將多尺度的淺層圖像特征和高層語義特征進行融合后的圖像數據模型通過非極大值抑制操作后得到LOGO的預測邊界框,進而獲取包含LOGO區域的圖像數據。
3.根據權利要求1所述一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,所述步驟S2,包括以下步驟:
步驟S2-1:根據圖像中LOGO的區域的邊界框信息截取LOGO區域圖像數據;
步驟S2-2:特征提取網絡將截取的LOGO區域圖像數據執行多個卷積運算或池化操作輸出;
步驟S2-3:將所有輸出進行特征融合,生成一個新的特征圖;
步驟S2-4:將融合后的特征圖進行卷積得到LOGO區域圖像的特征張量。
4.根據權利要求1所述一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,所述步驟S3,還包括:將包含LOGO區域的特征張量的高維空間特征點映射至低維空間進行映射,通過計算映射關系獲取低維空間的特征向量。
5.根據權利要求4所述一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,所述將包含LOGO區域的特征張量的高維空間特征點映射至低維空間進行映射,通過計算映射關系獲取低維空間的特征向量,包括以下步驟:
步驟S3-1:建立特征空間映射方程,以輸出的低維特征向量的協方差矩陣為優化對象,計算步驟S3-2:協方差矩陣最大化的對應特征向量和特征值;
步驟S3-3:將協方差矩陣的特征值按大小進行排序,得到協方差矩陣對應特征向量的權重關系;
步驟S3-4:將協方差矩陣每個特征值對應的特征向量進行L2規范化,變為一個標量,將所有規范化得到的標量按照特征向量的權重關系進行排序得到一個新的低維特征向量,至此完成高維到低維的映射。
6.根據權利要求1所述一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,所述步驟S4,包括:對未知的LOGO圖像進行檢索識別時,讀取特征數據庫文件,計算待識別LOGO的特征向量與庫中的LOGO特征向量的歐式距離,根據歐式距離判斷LOGO相似度,取距離最短的圖像作為匹配到的LOGO。
7.根據權利要求6所述一種基于注意力機制圖像檢索的LOGO識別方法,其特征在于,所述步驟S4,還包括:將已有的LOGO圖像庫進行特征編碼,生成一個由大量LOGO特征向量和LOGO標簽一一對應特征編碼的特征數據庫文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州萬維創新科技有限公司,未經廣州萬維創新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010558069.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種意圖識別的方法
- 下一篇:一種貫流風葉及空調器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





