[發明專利]在線反饋的知識蒸餾方法和裝置在審
| 申請號: | 202111045792.0 | 申請日: | 2021-09-07 |
| 公開(公告)號: | CN113780528A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 王之梁;韓東岐;陳聞起;鐘瑩;王蘇;張晗;楊家海;施新剛;尹霞 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N20/00;G06K9/62 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅嵐 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 在線 反饋 知識 蒸餾 方法 裝置 | ||
1.一種在線反饋的知識蒸餾方法,其特征在于,包括以下步驟:
基于兩個狀態機設計蒸餾模型,以構成決策系統,其中,第一個狀態機表示模型決策結果,第二個狀態機關聯所述模型決策結果和專家反饋狀態;
根據所述蒸餾模型將在線蒸餾過程分為兩個階段:更新階段和測試階段;其中,所述更新階段將更新后的專家反饋融入所述決策系統中,所述測試階段將所述蒸餾模型作為插件和原始模型一起參與決策。
2.根據權利要求1所述的在線反饋的知識蒸餾方法,其特征在于,所述第一個狀態機表示模型決策結果,包括:
尋找對于所述模型決策結果最重要的輸入部分,根據所述輸入部分的輸入特征的重要性,降序對所述輸入特征和特征值進行排序形成重要輸入特征序列,其中,所述最重要的輸入部分是用所述第一個狀態機中的相關狀態進行表示。
3.根據權利要求1所述的在線反饋的知識蒸餾方法,其特征在于,所述第二個狀態機關聯所述模型決策結果和專家反饋狀態,包括:
所述第二個狀態機包含所述第一個狀態機中所有M*N個狀態以及預設閾值數量的專家反饋狀態ri;所述第二個狀態機中將需要反饋的輸入特征序列中的每個特征對應的狀態連接到所述專家反饋狀態ri。
4.根據權利要求1所述的在線反饋的知識蒸餾方法,其特征在于,所述所述更新階段將更新后的專家反饋融入所述決策系統中,包括:
在所述更新階段根據更新規則,對所述重要輸入特征序列進行反饋;所述更新規則的過程是找到所述兩個狀態機中的轉移路徑,并更新所述兩個狀態機對應的轉移矩陣的率。
5.根據權利要求1所述的在線反饋的知識蒸餾方法,其特征在于,所述所述測試階段將所述蒸餾模型作為插件和原始模型一起參與決策,包括:
在所述測試階段給定所述重要輸入特征序列所述蒸餾模型自動匹配已有所述專家反饋狀態其中,所述蒸餾模型計算出所述特征序列匹配每個已有專家反饋狀態的概率,并選擇預設閾值的匹配概率的專家反饋狀態作為輸出,所述匹配概率由下面的公式計算:
其中,和分別表示在第一個和第二個狀態機中的轉移概率,K是重要輸入特征序列的長度。
6.一種在線反饋的知識蒸餾裝置,其特征在于,包括:
設計模塊,用于基于兩個狀態機設計蒸餾模型,以構成決策系統,其中,第一個狀態機表示模型決策結果,第二個狀態機關聯所述模型決策結果和專家反饋狀態;
在線蒸餾模塊,用于根據所述蒸餾模型將在線蒸餾過程分為兩個階段:更新階段和測試階段;其中,所述更新階段將更新后的專家反饋融入所述決策系統中,所述測試階段將所述蒸餾模型作為插件和原始模型一起參與決策。
7.根據權利要求6所述的在線反饋的知識蒸餾裝置,其特征在于,所述設計模塊,還用于:
尋找對于所述模型決策結果最重要的輸入部分,根據所述輸入部分的輸入特征的重要性,降序對所述輸入特征和特征值進行排序形成重要輸入特征序列,其中,所述最重要的輸入部分是用所述第一個狀態機中的相關狀態進行表示。
8.根據權利要求6所述的在線反饋的知識蒸餾裝置,其特征在于,所述設計模塊,包括狀態機模塊,用于:
所述第二個狀態機包含所述第一個狀態機中所有M*N個狀態以及預設閾值數量的專家反饋狀態ri;所述第二個狀態機中將需要反饋的輸入特征序列中的每個特征對應的狀態連接到所述專家反饋狀態ri。
9.根據權利要求6所述的在線反饋的知識蒸餾裝置,其特征在于,所述在線蒸餾模塊,還用于:
在所述更新階段根據更新規則,對所述重要輸入特征序列進行反饋;所述更新規則的過程是找到所述兩個狀態機中的轉移路徑,并更新所述兩個狀態機對應的轉移矩陣的概率。
10.根據權利要求6所述的在線反饋的知識蒸餾裝置,其特征在于,所述在線蒸餾模塊,還用于:
在所述測試階段給定所述重要輸入特征序列所述蒸餾模型自動匹配已有所述專家反饋狀態其中,所述蒸餾模型計算出所述特征序列匹配每個已有專家反饋狀態的概率,并選擇預設閾值的匹配概率的專家反饋狀態作為輸出,所述匹配概率由下面的公式計算:
其中,和分別表示在第一個和第二個狀態機中的轉移概率,K是重要輸入特征序列的長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111045792.0/1.html,轉載請聲明來源鉆瓜專利網。





