[發(fā)明專利]圖像的區(qū)域定位方法和目標區(qū)域定位模型的訓練方法在審
| 申請?zhí)枺?/td> | 201911004758.1 | 申請日: | 2019-10-22 |
| 公開(公告)號: | CN110766027A | 公開(公告)日: | 2020-02-07 |
| 發(fā)明(設計)人: | 葉燕罡;陳銘良;沈小勇 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 44224 廣州華進聯(lián)合專利商標代理有限公司 | 代理人: | 董慧 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本圖像 目標區(qū)域 初始定位 定位模型 區(qū)域定位 激活 注意力集中 定位結果 模型參數(shù) 目標類別 目標類型 訓練目標 遺漏 圖像 申請 | ||
1.一種圖像的區(qū)域定位方法,包括:
獲取待處理圖像;
通過目標區(qū)域定位模型獲取所述待處理圖像對應的類激活圖;
其中,所述目標區(qū)域定位模型是使用屬于目標類別的樣本圖像集訓練初始定位模型時,當根據(jù)各樣本圖像的類激活圖確定的目標區(qū)域未完全覆蓋相應樣本圖像中與所述目標類別相關的區(qū)域時,則繼續(xù)使用所述樣本圖像對所述初始定位模型的模型參數(shù)進行調整得到的,各所述樣本圖像對應的類激活圖是通過所述初始定位模型對所述樣本圖像進行處理獲得的;
根據(jù)所述待處理圖像對應的類激活圖確定所述待處理圖像中的目標區(qū)域。
2.根據(jù)權利要求1所述的方法,其特征在于,所述通過目標區(qū)域定位模型獲取所述待處理圖像對應的類激活圖,包括:
將所述待處理圖像輸入至目標區(qū)域定位模型;
通過所述目標區(qū)域定位模型中的卷積層對所述待處理圖像進行特征提取,獲得所述待處理圖像對應的多通道特征圖;
通過所述目標區(qū)域定位模型中的分類層,用對應所述目標類別的權重對各通道的特征圖進行加權求和,得到所述待處理圖像對應所述目標類別的類激活圖。
3.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述待處理圖像對應的類激活圖確定所述待處理圖像中的目標區(qū)域,包括:
將所述類激活圖進行歸一化處理和尺度縮放處理,獲得所述待處理圖像中各像素點屬于目標區(qū)域的概率;
從所述待處理圖像中確定所對應的所述概率大于預設閾值的像素點;
將確定的像素點構成的區(qū)域作為待處理圖像中的目標區(qū)域。
4.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述待處理圖像對應的類激活圖確定所述待處理圖像中的目標區(qū)域,包括:
將所述類激活圖進行歸一化處理和尺度縮放處理,獲得所述待處理圖像中各像素點屬于目標區(qū)域的概率;
從所述待處理圖像中確定所對應的所述概率大于預設閾值的像素點;
根據(jù)所述像素點的坐標,從所述像素點中確定頂點像素點;
根據(jù)所述頂點像素點獲取矩形區(qū)域;
將所述矩形區(qū)域作為所述待處理圖像中的目標區(qū)域。
5.根據(jù)權利要求4所述的方法,其特征在于,所述將所述矩形區(qū)域作為所述待處理圖像中的目標區(qū)域,包括:
當獲取的矩形區(qū)域的尺寸小于預設閾值時,過濾掉所述矩形區(qū)域;
當獲取的矩形區(qū)域中包括部分重疊的多個矩形區(qū)域時,根據(jù)所述多個矩形區(qū)域確定包括所述多個矩形區(qū)域的最小矩形區(qū)域,并將確定的所述最小矩形區(qū)域作為所述待處理圖像中的目標區(qū)域。
6.根據(jù)權利要求1至5任一項所述的方法,其特征在于,所述目標區(qū)域為所述待處理圖像中的敏感區(qū)域,所述方法還包括:
對所述敏感區(qū)域進行模糊處理或馬賽克處理;
顯示經過處理后的待處理圖像。
7.一種目標區(qū)域定位模型的訓練方法,包括:
獲取屬于目標類別的樣本圖像集;
通過初始定位模型獲取所述樣本圖像集中的各樣本圖像對應的類激活圖;
根據(jù)所述類激活圖確定所述樣本圖像中的目標區(qū)域;
當確定的所述目標區(qū)域未完全覆蓋所述樣本圖像中與所述目標類別相關的區(qū)域時,則繼續(xù)使用所述樣本圖像對所述初始定位模型的模型參數(shù)進行調整,得到用于對圖像中的目標區(qū)域進行定位的目標區(qū)域定位模型。
8.根據(jù)權利要求7所述的方法,其特征在于,所述通過初始定位模型獲取所述樣本圖像集中的各樣本圖像對應的類激活圖,包括:
將所述樣本圖像輸入至所述初始定位模型;
通過所述初始定位模型中的卷積層對所述樣本圖像進行特征提取,獲得所述樣本圖像對應的多通道特征圖;
通過所述初始定位模型中的分類層,用對應所述目標類別的權重對各通道的特征圖進行加權求和,得到所述樣本圖像對應所述目標類別的類激活圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911004758.1/1.html,轉載請聲明來源鉆瓜專利網。





