[發明專利]圖像屬性的確定方法、裝置、終端設備和存儲介質在審
| 申請號: | 202011194935.X | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112287847A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 李保俊;劉濤;黃家冕;曾鵬;興百橋 | 申請(專利權)人: | 廣州華多網絡科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 蘇云輝 |
| 地址: | 511442 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 屬性 確定 方法 裝置 終端設備 存儲 介質 | ||
1.一種圖像屬性的確定方法,其特征在于,所述方法包括:
獲取待識別圖像;
將所述待識別圖像輸入至預先訓練的圖像屬性分類模型,分別輸出所述待識別圖像的圖像角度概率值和文字類型概率值;其中,所述圖像屬性分類模型是采用標記有圖像角度信息和文字類型信息的圖像樣本對改進的Efficient網絡進行訓練得到的,所述改進的Efficient網絡包括多個Attention-MBConv模塊,每個所述Attention-MBConv模塊串行連接,所述Attention-MBConv模塊是在MBConv模塊的最后一個特征輸出層之后加入注意力模塊而形成的;
根據所述圖像角度概率值和所述文字類型概率值分別確定圖像角度和文字類型。
2.根據權利要求1所述的方法,其特征在于,所述改進的Efficient網絡包括深度特征提取網絡、兩個第一全連接層、兩個第二全連接層和兩個softmax分類層;其中所述深度特征提取網絡多個Attention-MBConv模塊和兩個卷積模塊,所述Attention-MBConv模塊設置在兩個所述卷積模塊之間;所述圖像屬性分類模型的訓練方法,包括:
獲取圖像樣本,采用圖像角度信息和文字類型信息對所述圖像樣本進行標記,得到標記有圖像角度信息和文字類型信息的圖像樣本;
將所述標記有圖像角度信息和文字類型信息的圖像樣本輸入所述深度特征提取網絡進行特征提取,得到深度特征圖;
將所述深度特征圖分別依次輸入兩個所述第一全連接層、兩個所述第二全連接層和兩個所述softmax分類層,輸出實際分類結果;
對所述改進的Efficient網絡的權重進行調整,直至實際分類結果與目標分類結果的偏差在容許范圍內時,訓練完成,得到所述圖像屬性分類模型。
3.根據權利要求2所述的方法,其特征在于,所述Attention-MBConv模塊包括第一卷積層、ReLU層、第二卷積層和注意力模塊;將所述圖像樣本輸入所述深度特征提取網絡進行特征提取,得到深度特征圖的步驟中包括:
將第一特征圖輸入所述第一卷積層進行卷積處理得到第二特征圖;其中所述第一特征圖是位于當前Attention-MBConv模塊之前的卷積模塊和Attention-MBConv模塊對所述標記有圖像角度信息和文字類型信息的圖像樣本進行處理輸出的特征圖;
將所述第二特征圖輸入所述ReLU層進行ReLU和深度卷積處理得到第三特征圖;
將所述第三特征圖輸入所述第二卷積層進行卷積處理得到第四特征圖;
將所述第四特征圖輸入所述注意力模塊進行加權計算,得到加權處理后的特征圖;
將所述加權處理后的特征圖輸入位于所述當前Attention-MBConv模塊之后的Attention-MBConv模塊或所述卷積模塊進行輸出,得到所述深度特征圖。
4.根據權利要求2所述的方法,其特征在于,在對所述改進的Efficient網絡的權重進行調整的步驟中,包括:
對采用梯度下降方法所述改進的Efficient網絡的權重進行調整;其中損失函數采用加權損失函數。
5.根據權利要求1-4任一項所述的方法,其特征在于,將所述標記有圖像角度信息和文字類型信息的圖像樣本輸入所述深度特征提取網絡進行特征提取的步驟之前,包括:
將所述標記有圖像角度信息和文字類型信息的圖像樣本按照預設縮放范圍進行縮放處理。
6.根據權利要求5所述的方法,其特征在于,將所述標記有圖像角度信息和文字類型信息的圖像樣本輸入所述深度特征提取網絡進行特征提取的步驟之前,還包括:
按照預設選擇概率選擇一種或多種增強處理方法對縮放處理后的所述圖像樣本進行增強處理;
其中當選擇多種增強處理方法時,每一種增強處理方法的運行順序是隨機的,所述增強處理方法包括對所述圖像樣本的RGB三通道進行隨機變換順序處理、亮度變換處理、壓縮處理、運動模糊處理和添加噪聲處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州華多網絡科技有限公司,未經廣州華多網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011194935.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種甲醇燃料電池無人機
- 下一篇:可升降式智能安防護欄
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





