[發(fā)明專利]一種對齊分類模型的訓(xùn)練方法和圖像分類方法有效
| 申請?zhí)枺?/td> | 201910061366.2 | 申請日: | 2019-01-22 |
| 公開(公告)號: | CN109902716B | 公開(公告)日: | 2021-01-29 |
| 發(fā)明(設(shè)計(jì))人: | 許益鴻;齊子銘;涂清華;李志陽;張偉 | 申請(專利權(quán))人: | 廈門美圖之家科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66;G06N3/04;G06N3/08 |
| 代理公司: | 北京思睿峰知識產(chǎn)權(quán)代理有限公司 11396 | 代理人: | 謝建云;張贊 |
| 地址: | 361008 福建省廈門*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 對齊 分類 模型 訓(xùn)練 方法 圖像 | ||
1.一種對齊分類模型的訓(xùn)練方法,適于在計(jì)算設(shè)備中執(zhí)行,所述對齊分類模型包括主網(wǎng)絡(luò)、第一分支網(wǎng)絡(luò)和第二分支網(wǎng)絡(luò),所述主網(wǎng)絡(luò)和第一分支網(wǎng)絡(luò)構(gòu)成對齊模型,適于輸出預(yù)測特征點(diǎn)的坐標(biāo),所述主網(wǎng)絡(luò)和第二分支網(wǎng)絡(luò)構(gòu)成分類模型,適于輸出預(yù)測圖像類別的概率,所述方法包括:
獲取經(jīng)過標(biāo)注的訓(xùn)練圖像,所述訓(xùn)練圖像具有相應(yīng)的標(biāo)注數(shù)據(jù),所述標(biāo)注數(shù)據(jù)包含圖像的類別;
將所述訓(xùn)練圖像輸入分類模型中進(jìn)行訓(xùn)練,以得到訓(xùn)練后的第二分支網(wǎng)絡(luò);以及
將所述訓(xùn)練圖像輸入對齊分類模型中進(jìn)行訓(xùn)練,優(yōu)化所述第二分支網(wǎng)絡(luò),以得到訓(xùn)練后的對齊分類模型。
2.如權(quán)利要求1所述的方法,其中,所述訓(xùn)練圖像包括狗臉圖像、貓臉圖像和其他圖像,
貓臉圖像標(biāo)注為0,狗臉圖像標(biāo)注為1,其他圖像標(biāo)注為2。
3.如權(quán)利要求1所述的方法,其中,所述方法包括:
將已標(biāo)注特征點(diǎn)的圖像輸入對齊模型中,以輸出預(yù)測特征點(diǎn)的坐標(biāo);
基于標(biāo)注特征點(diǎn)坐標(biāo)與預(yù)測特征點(diǎn)坐標(biāo)的距離,計(jì)算第一損失函數(shù)的值;以及
基于第一損失函數(shù)的值調(diào)整對齊模型的參數(shù),以得到訓(xùn)練好的對齊模型。
4.如權(quán)利要求3所述的方法,其中,所述對齊模型為狗臉對齊模型,適于輸出狗臉點(diǎn)坐標(biāo)。
5.如權(quán)利要求1所述的方法,其中,所述將訓(xùn)練圖像輸入分類模型中進(jìn)行訓(xùn)練的步驟包括:
基于訓(xùn)練好的對齊模型中主網(wǎng)絡(luò)的參數(shù)和正態(tài)分布初始化方法,初始化分類模型的參數(shù);
基于標(biāo)注圖像類別和預(yù)測圖像類別,計(jì)算第二損失函數(shù)的值;以及
基于預(yù)設(shè)的主網(wǎng)絡(luò)的第一學(xué)習(xí)率、第二分支網(wǎng)絡(luò)的第二學(xué)習(xí)率以及第二損失函數(shù)的值,訓(xùn)練所述分類模型。
6.如權(quán)利要求5所述的方法,其中,所述初始化分類模型的參數(shù)的步驟包括:
在達(dá)到預(yù)定迭代次數(shù)的情況下,將所述主網(wǎng)絡(luò)的參數(shù)重新初始化為訓(xùn)練好的對齊模型中主網(wǎng)絡(luò)的參數(shù)。
7.如權(quán)利要求5所述方法,其中,所述第一學(xué)習(xí)率大于所述第二學(xué)習(xí)率。
8.如權(quán)利要求5所述的方法,其中,所述第二損失函數(shù)為交叉熵?fù)p失函數(shù),所述交叉熵?fù)p失函數(shù)通過下述公式計(jì)算:
其中,y′為已標(biāo)注圖像類別,y為預(yù)測的圖像類別,i為圖像的索引。
9.如權(quán)利要求1所述的方法,其中,所述主網(wǎng)絡(luò)包括由卷積層、激活層、池化層組成的卷積處理層,其中設(shè)置有多個(gè)分組卷積。
10.如權(quán)利要求1所述的方法,其中,所述第一分支網(wǎng)絡(luò)包括由多個(gè)全連接層和dropout層組成的分類處理層,所述第二分支網(wǎng)絡(luò)包括卷積層、激活層、池化層、全連接層和歸一化層。
11.一種圖像分類方法,適于在計(jì)算設(shè)備中執(zhí)行,所述方法包括:
將待分類圖像輸入所述對齊分類模型中,以輸出待分類圖像所屬的圖像類別,
其中所述對齊分類模型利用如權(quán)利要求1-10中任一項(xiàng)所述的方法來訓(xùn)練生成。
12.如權(quán)利要求11所述的方法,其中,所述方法包括:
當(dāng)待分類圖像中包含狗臉圖像時(shí),輸出預(yù)測的狗臉點(diǎn)坐標(biāo)。
13.一種計(jì)算設(shè)備,包括:
存儲器;
一個(gè)或多個(gè)處理器;
一個(gè)或多個(gè)程序,其中所述一個(gè)或多個(gè)程序存儲在所述存儲器中并被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述一個(gè)或多個(gè)程序包括用于執(zhí)行根據(jù)權(quán)利要求1-12所述方法中的任一方法的指令。
14.一種存儲一個(gè)或多個(gè)程序的計(jì)算機(jī)可讀存儲介質(zhì),所述一個(gè)或多個(gè)程序包括指令,所述指令當(dāng)計(jì)算設(shè)備執(zhí)行時(shí),使得所述計(jì)算設(shè)備執(zhí)行根據(jù)權(quán)利要求1-12所述的方法中的任一方法的指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門美圖之家科技有限公司,未經(jīng)廈門美圖之家科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910061366.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





