[發明專利]訓練神經網絡的方法、裝置和系統及存儲指令的存儲介質在審
| 申請號: | 201911086516.1 | 申請日: | 2019-11-08 |
| 公開(公告)號: | CN112784978A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 汪德宇;陳則瑋;溫東超;劉俊杰;陶瑋 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 北京怡豐知識產權代理有限公司 11293 | 代理人: | 遲軍;李艷麗 |
| 地址: | 日本國東京都*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 神經網絡 方法 裝置 系統 存儲 指令 介質 | ||
本發明公開一種訓練神經網絡的方法、裝置和系統及存儲指令的存儲介質。在訓練神經網絡的方法中,神經網絡包括第一神經網絡和第二神經網絡,第一神經網絡的訓練還未完成且第二神經網絡的訓練還未開始,對于當前的第一神經網絡和當前的第二神經網絡,該方法包括:將樣本圖像經由當前的第一神經網絡得到第一輸出,將樣本圖像經由當前的第二神經網絡得到第二輸出;以及,根據第一損失函數值更新當前的第一神經網絡,根據第二損失函數值更新當前的第二神經網絡,其中,第一損失函數值根據第一輸出獲得,第二損失函數值根據第一輸出和第二輸出獲得。根據本公開,可改善第二神經網絡的性能及減少第一神經網絡和第二神經網絡的整體訓練時間。
技術領域
本發明涉及圖像處理,尤其涉及例如訓練神經網絡的方法、裝置和系統及存儲指令的存儲介質。
背景技術
當前,指導學習算法(例如,知識蒸餾算法)被廣泛地用于深度學習,以使得學習能力較弱的輕量級神經網絡(通常被稱為“學生神經網絡”)能夠從學習能力較強的深度神經網絡(通常被稱為“教師神經網絡”)學習更多的經驗,從而改善學生神經網絡的性能。通常,在訓練神經網絡的過程中,教師神經網絡將事先被訓練好,之后學生神經網絡再模仿學習教師神經網絡以完成相應的訓練操作。
非專利文獻“Distilling Detectors with Fine-grained Feature Imitation”(Tao Wang,Li Yuan,Xiaopeng Zhang,Jiashi Feng;CVPR 2019)中公開了一種示例性的學生神經網絡模仿學習教師神經網絡的方法。在該示例性的方法中,基于將樣本圖像經由已經訓練好的教師神經網絡而得到的特征來進行學生神經網絡模仿學習教師神經網絡的操作。具體操作為:1)生成模仿區域的操作:迭代地計算樣本圖像的標簽中的物體區域與預先設置的錨點框區域的交并比(Intersection-over-Union,IoU),組合交并比大于因子F(也即,過濾器閾值)的錨點框區域從而生成模仿區域;2)訓練學生神經網絡的操作:基于將樣本圖像經由已經訓練好的教師神經網絡而得到的特征中的所述模仿區域內的特征來指導學生神經網絡的更新,以使得學生神經網絡在所述模仿區域內的特征分布更接近于教師神經網絡的特征分布。
如上所述可知,在通常的指導學習方法中,需要事先完成教師神經網絡的訓練,之后再利用訓練好的教師神經網絡來指導學生神經網絡的訓練,這將使得需要大量的訓練時間才能完成教師神經網絡和學生神經網絡的訓練。此外,由于教師神經網絡已被事先訓練好,因此使得學生神經網絡無法很好地學習到訓練教師神經網絡的過程中的相關經驗,從而影響學生神經網絡的性能。
發明內容
鑒于上面的背景技術中的記載,本公開旨在解決上述問題中的至少一點。
根據本公開的一個方面,提供一種訓練神經網絡的方法,所述神經網絡包括第一神經網絡和第二神經網絡,其特征在于,所述第一神經網絡的訓練還未完成且所述第二神經網絡的訓練還未開始,其中,對于當前的第一神經網絡和當前的第二神經網絡,所述方法包括:輸出步驟,將樣本圖像經由所述當前的第一神經網絡得到第一輸出,將所述樣本圖像經由所述當前的第二神經網絡得到第二輸出;以及更新步驟,根據第一損失函數值更新所述當前的第一神經網絡,根據第二損失函數值更新所述當前的第二神經網絡,其中,所述第一損失函數值根據所述第一輸出獲得,所述第二損失函數值根據所述第一輸出和所述第二輸出獲得。
根據本公開的另一個方面,提供一種訓練神經網絡的裝置,所述神經網絡包括第一神經網絡和第二神經網絡,其特征在于,所述第一神經網絡的訓練還未完成且所述第二神經網絡的訓練還未開始,其中,對于當前的第一神經網絡和當前的第二神經網絡,所述裝置包括:輸出單元,將樣本圖像經由所述當前的第一神經網絡得到第一輸出,將所述樣本圖像經由所述當前的第二神經網絡得到第二輸出;以及更新單元,根據第一損失函數值更新所述當前的第一神經網絡,根據第二損失函數值更新所述當前的第二神經網絡,其中,所述第一損失函數值根據所述第一輸出獲得,所述第二損失函數值根據所述第一輸出和所述第二輸出獲得。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911086516.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:樹木涂白材料及其制備方法
- 下一篇:基板濕處理裝置及基板清洗方法





