[發(fā)明專利]圖像處理方法和裝置、存儲介質(zhì)和電子設備有效
| 申請?zhí)枺?/td> | 202010664687.4 | 申請日: | 2020-07-10 |
| 公開(公告)號: | CN111797266B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設計)人: | 蘇凱;王長虎 | 申請(專利權)人: | 北京字節(jié)跳動網(wǎng)絡技術有限公司 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06F16/532;G06F16/55 |
| 代理公司: | 北京英創(chuàng)嘉友知識產(chǎn)權代理事務所(普通合伙) 11447 | 代理人: | 王曉霞 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 存儲 介質(zhì) 電子設備 | ||
1.一種圖像處理方法,其特征在于,所述方法包括:
將待處理圖像輸入圖像處理模型;
獲取圖像處理模型輸出的檢索標簽和入庫標簽,其中,所述檢索標簽用于表征待處理圖像中物體的類別,所述入庫標簽用于表征是否將所述待處理圖像加入檢索庫中;
其中,所述圖像處理模型包括用于輸出檢索標簽的檢索分支,和用于輸出入庫標簽的入庫分支,
所述檢索分支,用于從所述待處理圖像中提取第一檢索特征,將所述第一檢索特征和第二檢索特征融合,得到最終檢索特征,并基于所述最終檢索特征輸出所述檢索標簽;
所述入庫分支,用于從所述待處理圖像中提取第一入庫特征,將所述第一入庫特征和第二入庫特征融合,得到最終入庫特征,并基于所述最終入庫特征輸出所述入庫標簽;
其中,所述第二檢索特征是由所述第一入庫特征轉換得到的,所述第二入庫特征是由所述第一檢索特征轉換得到的。
2.根據(jù)權利要求1所述的方法,其特征在于,通過卷積函數(shù)和激活函數(shù)將所述第一入庫特征轉換為所述第二檢索特征,并將所述第一檢索特征轉換為所述第二入庫特征,其中,所述第二檢索特征的維度比所述第一入庫特征的維度低,所述第二入庫特征的維度比所述第一檢索特征的維度低。
3.根據(jù)權利要求1所述的圖像處理方法,其特征在于,所述方法還包括:
基于所述檢索標簽,判斷是否從所述檢索庫中查詢與所述待處理圖像特征匹配的目標圖像和/或目標視頻,和/或
基于所述入庫標簽,判斷是否將所述待處理圖像加入所述檢索庫中,并在確定將所述待處理圖像加入檢索庫中的情況下,將所述待處理圖像和/或提取到所述待處理圖像的視頻加入所述檢索庫中。
4.根據(jù)權利要求1所述的方法,其特征在于,所述圖像處理模型是通過以下方式訓練得到的:
將已標注檢索標簽和入庫標簽的樣本圖像集輸入待訓練的圖像處理模型;
重復執(zhí)行基于所述圖像處理模型輸出的檢索標簽和入庫標簽,以及樣本圖像的實際檢索標簽和實際入庫標簽,以及預設的損失函數(shù),調(diào)整所述圖像處理模型的所述檢索分支和/或所述入庫分支的參數(shù)的步驟,直至滿足訓練停止條件;
其中,所述預設的損失函數(shù)包括用于生成所述檢索標簽的損失值的第一損失函數(shù),和用于生成所述入庫標簽的損失值的第二損失函數(shù)。
5.根據(jù)權利要求4所述的方法,其特征在于,所述檢索標簽包括表征物體為可檢索的類別的第一類標簽,所述入庫標簽包括表征圖片為不可入庫圖片的第二類標簽,
所述預設的損失函數(shù)還包括:
用于在所述檢索分支輸出的標簽為所述第一類標簽,且所述入庫分支針對同一圖片輸出的標簽為所述第二類標簽時產(chǎn)生損失值的第三損失函數(shù)。
6.根據(jù)權利要求5所述的方法,其特征在于,所述基于所述圖像處理模型輸出的檢索標簽和入庫標簽,以及樣本圖像的實際檢索標簽和實際入庫標簽,以及預設的損失函數(shù),調(diào)整所述圖像處理模型的所述檢索分支和/或所述入庫分支的參數(shù),包括:
通過第一損失函數(shù),基于所述圖像處理模型輸出的檢索標簽和實際檢索標簽生成第一損失值;
通過第二損失函數(shù),基于所述圖像處理模型輸出的入庫標簽和實際入庫標簽生成第二損失值;
通過第三損失函數(shù),基于所述圖像處理模型輸出的檢索標簽和入庫標簽生成第三損失值;
基于所述第一損失值、第二損失值和第三損失值,生成最終損失值,并基于所述最終損失值調(diào)整所述圖像處理模型的所述檢索分支和/或所述入庫分支的參數(shù)。
7.根據(jù)權利要求6所述的方法,其特征在于,所述基于所述第一損失值、第二損失值和第三損失值,生成最終損失值,包括:
通過下述方式生成最終損失值:
loss=L1×loss1+L2×loss2+loss3
其中,loss為所述最終損失值,loss1為所述第一損失值,loss2為所述第二損失值,loss3為所述第三損失值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節(jié)跳動網(wǎng)絡技術有限公司,未經(jīng)北京字節(jié)跳動網(wǎng)絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010664687.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





