[發(fā)明專利]一種通道自關聯(lián)的知識蒸餾方法與系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110673166.X | 申請日: | 2021-06-17 |
| 公開(公告)號: | CN113255899B | 公開(公告)日: | 2021-10-12 |
| 發(fā)明(設計)人: | 唐乾坤;徐曉剛;王軍;徐冠雷;何鵬飛;曹衛(wèi)強 | 申請(專利權)人: | 之江實驗室 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 杭州浙科專利事務所(普通合伙) 33213 | 代理人: | 孫孟輝 |
| 地址: | 310023 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通道 關聯(lián) 知識 蒸餾 方法 系統(tǒng) | ||
1.一種通道自關聯(lián)的知識蒸餾方法,其特征在于包括以下步驟:
步驟S1:向教師模型和學生模型中輸入相同的圖片數(shù)據(jù),得到學生模型和教師模型的圖片特征,選定學生模型和教師模型中需要進行知識蒸餾的卷積特征層,選定的學生模型的中間特征層為:,選定的教師模型的中間特征層為:,其中,
步驟S2:將選定的學生模型和教師模型卷積特征層的通道進行通道自關聯(lián),通道自關聯(lián)的方式如下:
設定一個二維整數(shù)矩陣,其中,,所述二維整數(shù)矩陣中值為正整數(shù),且僅為0或者1,所述二維整數(shù)矩陣的行表示選定的學生模型特征層的通道數(shù),列表示選定的教師模型特征層的通道數(shù),矩陣值為0時,表示學生模型特征層的行對應的通道,不從教師模型特征層的列對應的通道學習知識,矩陣值為1時,表示學生模型特征層的行對應的通道,從教師模型特征層的列對應的通道學習知識;學生模型的每個通道可以與教師模型的多個通道關聯(lián),而教師模型的每個通道可以傳輸知識到學生模型的多個通道;
步驟S3:自關聯(lián)后的教師模型通道通過加權方式傳輸知識至學生模型通道;
步驟S4:根據(jù)關聯(lián)的通道蒸餾知識,并進行訓練,在訓練時同時優(yōu)化自關聯(lián)的二維整數(shù)矩陣和學生模型:
其中,表示損失函數(shù),
步驟S5:部署訓練好的學生模型,輸入圖片數(shù)據(jù)進行推理測試。
2.根據(jù)權利要求1所述的一種通道自關聯(lián)的知識蒸餾方法,其特征在于所述步驟S1中,分別從教師模型和學生模型的中間卷積層中選擇一個以上特征層。
3.根據(jù)權利要求1所述的一種通道自關聯(lián)的知識蒸餾方法,其特征在于所述步驟S3中,學生模型每個通道在融合教師模型通道特征時,采用加權方式,權重包括但不限于通過計算每個關聯(lián)的教師模型和學生模型通道的語義相關性得到,其形式化為:
其中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于之江實驗室,未經(jīng)之江實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110673166.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





