[發明專利]圖像內容的識別方法、圖像識別模型的訓練方法及介質在審
| 申請號: | 202011261377.4 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112257665A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 彭健騰 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 徐立 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 內容 識別 方法 模型 訓練 介質 | ||
1.一種圖像內容的識別方法,其特征在于,所述方法包括:
將目標圖像輸入至圖像識別模型,得到目標特征;
將所述目標特征輸入至檢測器,得到目標檢測結果,所述檢測器用于根據所述目標特征確定所述目標圖像中的目標圖像內容包含情況;
所述圖像識別模型是通過對融合特征進行比對識別,并根據所述比對識別的結果更新所述圖像識別模型,直至所述圖像識別模型收斂得到。
2.根據權利要求1所述的方法,其特征在于,所述圖像識別模型的訓練過程包括:
獲取訓練圖像集,所述訓練圖像集中包括第一訓練圖像和第二訓練圖像;
通過所述圖像識別模型提取所述第一訓練圖像的第一特征和所述第二訓練圖像的第二特征;
識別所述第一特征的第一識別結果和所述第二特征的第二識別結果;
對所述第一特征和所述第二特征融合后的融合特征進行比對識別,得到第三識別結果;
基于所述第一識別結果、所述第二識別結果和所述第三識別結果得到損失值,對所述圖像識別模型進行訓練。
3.根據權利要求2所述的方法,其特征在于,所述對所述第一特征和所述第二特征融合后的融合特征進行比對識別,得到第三識別結果,包括:
對所述融合特征進行第一比對識別,得到第一比對識別結果,所述第一比對識別結果用于表示所述第一訓練圖像和所述第二訓練圖像中所述目標圖像內容的相似度。
4.根據權利要求3所述的方法,其特征在于,所述對所述第一特征和所述第二特征融合后的融合特征進行比對識別,得到第三識別結果,包括:
對所述融合特征進行第二比對識別,得到第二比對識別結果,所述第二比對識別結果用于表示所述第一訓練圖像中的所述目標圖像內容對應尺寸與所述第二訓練圖像中的所述目標圖像內容對應尺寸的大小關系。
5.根據權利要求2至4任一所述的方法,其特征在于,所述基于所述第一識別結果、所述第二識別結果和所述第三識別結果得到損失值,對所述圖像識別模型進行訓練,包括:
將所述第一識別結果、所述第二識別結果和所述第三識別結果輸入預設損失函數,得到所述損失值;
基于所述損失值對所述圖像識別模型進行訓練。
6.根據權利要求5所述的方法,其特征在于,所述將所述第一識別結果、所述第二識別結果和所述第三識別結果輸入預設損失函數,得到所述損失值,包括:
將所述第一識別結果輸入所述預設損失函數,得到第一損失值;
將所述第二識別結果輸入所述預設損失函數,得到第二損失值;
將所述第三識別結果輸入所述預設損失函數,得到第三損失值;
基于所述第一損失值、所述第二損失值和所述第三損失值確定所述損失值。
7.根據權利要求2至4任一所述的方法,其特征在于,所述圖像識別模型包括模型參數;
所述基于所述第一識別結果、所述第二識別結果和所述第三識別結果得到損失值,對所述圖像識別模型進行訓練,包括:
根據所述損失值對所述模型參數進行調整。
8.根據權利要求2至4任一所述的方法,其特征在于,所述訓練圖像集包含所述目標圖像內容的訓練圖像標注有第一標簽;
所述方法還包括:
針對標注有所述第一標簽的第三訓練圖像,以所述目標圖像內容的顯示區域為基準進行分割,得到至少兩個圖像區域;
對所述至少兩個圖像區域進行重組,得到更新訓練圖像;
將所述更新訓練圖像增加至所述訓練圖像集中,作為標注有所述第一標簽的所述訓練圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011261377.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





