[發明專利]圖片識別模型的訓練方法、識別方法、系統、設備和介質在審
| 申請號: | 202110321375.8 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN113065443A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 楊凱;羅超;胡泓;李巍 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 楊東明;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 識別 模型 訓練 方法 系統 設備 介質 | ||
1.一種圖片識別模型的訓練方法,其特征在于,所述訓練方法包括:
獲取多個圖片,根據預設的分類標簽對所述圖片進行標注得到標簽圖片,以構造初始訓練數據集;其中,所述圖片包括具有明確場景的目標圖片和不具有明確場景的干擾圖片;所述預設的分類標簽包括若干個分別與所述目標圖片中的場景相對應的場景標簽和一個與所述干擾圖片相對應的非場景標簽;
采用卷積神經網絡作為基礎網絡,并在所述卷積神經網絡層中增加分支卷積層,以構建圖片識別模型的網絡結構;所述分支卷積層用于將所述基礎網絡中的多級特征圖進行融合;
將多個所述標簽圖片輸入至所述圖片識別模型的網絡結構中進行訓練以生成所述圖片識別模型。
2.如權利要求1所述的圖片識別模型的訓練方法,其特征在于,所述采用卷積神經網絡作為基礎網絡,并在所述卷積神經網絡層中增加分支卷積層,以構建圖片識別模型的網絡結構的步驟包括:
采用wide resnet50作為基礎網絡,wide resnet50包括第一輸出層、第二輸出層、第三輸出層、第四輸出層、第五輸出層、全連接層;
分別在所述第二輸出層的輸出端、所述第三輸出層的輸出端、所述第四輸出層的輸出端增加第一分支卷積層、第二分支卷積層、第三分支卷積層,以構建所述圖片識別模型的網絡結構;
所述第一分支卷積層用于接收第二輸出層輸出的特征圖并將所述第二輸出層輸出的特征圖的尺寸和通道數進行變換,以得到第一分支卷積層輸出的特征圖;
所述第二分支卷積層用于接收第一融合特征圖并將所述第一融合特征圖的尺寸和通道數進行變換以得到第二分支卷積層輸出的特征圖,其中,所述第一融合特征圖通過將所述第一分支卷積層輸出的特征圖與所述第三輸出層輸出的特征圖相融合之后得到;
所述第三分支卷積層用于接收第二融合特征圖并將所述第二融合特征圖的尺寸和通道數進行變換以得到第三分支卷積層輸出的特征圖,其中,所述第二融合特征圖通過將所述第二分支卷積層輸出的特征圖與所述第四輸出層輸出的特征圖相融合之后得到;
所述全連接層用于接收第三融合特征圖,其中,所述第三融合特征圖通過將所述第三分支卷積層輸出的特征圖與所述第五輸出層輸出的特征圖相融合之后得到;
其中,所述第一分支卷積層輸出的特征圖與所述第三輸出層輸出的特征圖的尺寸和通道數相同;所述第二分支卷積層輸出的特征圖與所述第四輸出層輸出的特征圖的尺寸和通道數相同;所述第三分支卷積層輸出的特征圖與所述第五輸出層輸出的特征圖的尺寸和通道數相同。
3.如權利要求1所述的圖片識別模型的訓練方法,其特征在于,所述將多個所述標簽圖片數據輸入至所述圖片識別模型的網絡結構中進行訓練以生成所述圖片識別模型的步驟還包括:
利用加權的交叉熵損失作為主損失函數、Ring loss作為輔助損失函數,以獲得所述圖片識別模型的網絡結構的損失值;
基于所述圖片識別模型的網絡結構的損失值,采用動量的隨機梯度下降算法對所述圖片識別模型的網絡結構的參數進行優化,以得到模型的優化參數;
采用遷移學習的方法,對學習率進行設置,并對模型的優化參數進行調整,以使得圖片識別模型的準確率達到預設閾值。
4.一種圖片識別方法,其特征在于,所述圖片識別方法包括:
獲取待識別的圖片;
將所述待識別的圖片輸入至圖片識別模型中進行識別,以得到所述標簽圖片的概率值;
所述圖片識別模型使用如權利要求1至3任一項所述的圖片識別模型的訓練方法生成。
5.一種圖片識別模型的訓練系統,其特征在于,所述訓練系統包括:
第一獲取模塊,用于獲取多個圖片,根據預設的分類標簽對所述圖片進行標注得到標簽圖片,以構造初始訓練數據集;其中,所述圖片包括具有明確場景的目標圖片和不具有明確場景的干擾圖片;所述預設的分類標簽包括若干個分別與所述目標圖片中的場景相對應的場景標簽和一個與所述干擾圖片相對應的非場景標簽;
構建模塊,用于采用卷積神經網絡作為基礎網絡,并在所述卷積神經網絡層中增加分支卷積層,以構建圖片識別模型的網絡結構;所述分支卷積層用于將所述基礎網絡中的多級特征圖進行融合;
生成模塊,用于將多個所述標簽圖片輸入至所述圖片識別模型的網絡結構中進行訓練以生成所述圖片識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110321375.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種適應多種標準型材的早拆裝置
- 下一篇:一種改進的分體式光伏組件接線盒





