[發(fā)明專利]模型訓(xùn)練方法、圖像類別檢測方法、裝置和電子設(shè)備在審
| 申請?zhí)枺?/td> | 202010501581.2 | 申請日: | 2020-06-04 |
| 公開(公告)號: | CN111860573A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計)人: | 周博言;魏秀參;崔權(quán) | 申請(專利權(quán))人: | 北京邁格威科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 王婷婷 |
| 地址: | 100086 北京市海淀區(qū)科*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 訓(xùn)練 方法 圖像 類別 檢測 裝置 電子設(shè)備 | ||
1.一種圖像類別檢測模型的訓(xùn)練方法,其特征在于,所述方法包括:
獲取樣本集,所述樣本集包括具有類別標(biāo)注的圖像樣本;
基于各類別的圖像樣本的數(shù)量,確定各類別的圖像樣本的目標(biāo)采樣概率,其中,各類別的圖像樣本的數(shù)量與目標(biāo)采樣概率呈反比;
分別以隨機(jī)采樣方式和基于所述目標(biāo)采樣概率的采樣方式,采樣所述樣本集中的圖像樣本,并執(zhí)行如下訓(xùn)練步驟:將以不同采樣方式采樣的圖像樣本輸入至包含雙分支網(wǎng)絡(luò)的初始模型中的不同分支網(wǎng)絡(luò),得到所述初始模型輸出的類別檢測結(jié)果;基于所述類別檢測結(jié)果和所采樣的圖像樣本的類別標(biāo)注,確定損失值,并基于所述損失值更新所述初始模型中的參數(shù);當(dāng)所述初始模型訓(xùn)練完成時,將訓(xùn)練后的初始模型確定為圖像類別檢測模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
當(dāng)所述初始模型訓(xùn)練完成前,重新以所述不同采樣方式采樣所述樣本集中的圖像樣本,并使用更新參數(shù)后的初始模型和所重新采樣的圖像樣本,繼續(xù)執(zhí)行所述訓(xùn)練步驟。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于各類別的圖像樣本的數(shù)量,確定各類別的圖像樣本的目標(biāo)采樣概率,包括:
統(tǒng)計所述樣本集中各類別的圖像樣本的數(shù)量;
確定所統(tǒng)計的數(shù)量中的最大值與各類別的圖像樣本的數(shù)量的比值;
對所確定的各比值進(jìn)行求和,得到求和結(jié)果;
對于每一個類別,將該類別的圖像樣本的數(shù)量與所述求和結(jié)果的比值,作為該類別的圖像樣本的目標(biāo)采樣概率。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述雙分支網(wǎng)絡(luò)包括第一分支網(wǎng)絡(luò)和第二分支網(wǎng)絡(luò),第一分支網(wǎng)絡(luò)包括第一特征提取網(wǎng)絡(luò)和第一分類器,所述第二分支網(wǎng)絡(luò)包括第二特征提取網(wǎng)絡(luò)和第二分類器;以及,
所述將以不同采樣方式采樣的圖像樣本輸入至包含雙分支網(wǎng)絡(luò)的初始模型中的不同分支網(wǎng)絡(luò),得到所述初始模型輸出的類別檢測結(jié)果,包括:
將以隨機(jī)采樣方式采樣的圖像樣本輸入至所述第一特征提取網(wǎng)絡(luò),得到第一特征信息,并將基于所述采樣概率采樣的圖像樣本輸入至所述第二特征提取網(wǎng)絡(luò),得到第二特征信息;
分別對所述第一特征信息和所述第二特征信息進(jìn)行加權(quán);
將加權(quán)后的第一特征信息輸入至所述第一分類器,得到第一分類結(jié)果,并將加權(quán)后的第二特征信息輸入至所述第二分類器,得到第二分類結(jié)果;
將所述第一分類結(jié)果和所述第二分類結(jié)果進(jìn)行融合,輸出類別檢測結(jié)果。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述分別對所述第一特征信息和所述第二特征信息進(jìn)行加權(quán),包括:
確定當(dāng)前訓(xùn)練的周期數(shù)和預(yù)設(shè)的周期總數(shù);
確定所述周期數(shù)與所述周期總數(shù)的比值的平方數(shù);
將所述平方數(shù)作為所述第二特征信息的權(quán)重,將預(yù)設(shè)數(shù)值與所述權(quán)重的差值作為所述第一特征信息的權(quán)重,分別對所述第一特征信息和所述第二特征信息進(jìn)行加權(quán)。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第一分類結(jié)果和所述第二分類結(jié)果均為向量;以及,
所述將所述第一分類結(jié)果和所述第二分類結(jié)果進(jìn)行融合,得到所述初始模型輸出的類別檢測結(jié)果,包括:
將所述第一分類結(jié)果和所述第二分類結(jié)果按元素相加,得到目標(biāo)向量;
將所述目標(biāo)向量輸入至預(yù)設(shè)的歸一化指數(shù)函數(shù),得到類別檢測結(jié)果。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第一特征提取網(wǎng)絡(luò)和所述第二特征提取網(wǎng)絡(luò)分別包括隱藏層、殘差層和全局平均池化層,所述隱藏層包括至少一個卷積層,所述第一特征提取網(wǎng)絡(luò)的隱藏層和所述第二特征提取網(wǎng)絡(luò)的隱藏層的參數(shù)共享。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京邁格威科技有限公司,未經(jīng)北京邁格威科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010501581.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





