[發明專利]在線反饋的知識蒸餾方法和裝置在審
| 申請號: | 202111045792.0 | 申請日: | 2021-09-07 |
| 公開(公告)號: | CN113780528A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 王之梁;韓東岐;陳聞起;鐘瑩;王蘇;張晗;楊家海;施新剛;尹霞 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N20/00;G06K9/62 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅嵐 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 在線 反饋 知識 蒸餾 方法 裝置 | ||
本申請公開了一種在線反饋的知識蒸餾方法及裝置,該方法包括:基于兩個狀態機設計蒸餾模型,以構成決策系統,其中,第一個狀態機表示模型決策結果,第二個狀態機關聯模型決策結果和專家反饋狀態;根據蒸餾模型將在線蒸餾過程分為兩個階段:更新階段和測試階段;其中,更新階段將更新后的專家反饋融入決策系統中,測試階段將蒸餾模型作為插件和原始模型一起參與決策。本發明不依賴于全新的蒸餾模型進行檢測,同時能很好的支持在線反饋和更新蒸餾模型,易于維護和使用,通用性強。基于蒸餾模型,操作人員可以更快的進行模型理解,模型的檢測效果也能得到有效提升。
技術領域
本發明涉及人工智能、機器學習技術領域,特別涉及一種在線反饋的知識蒸餾方法和裝置。
背景技術
近年來,人工智能、機器學習技術被廣泛應用到各類網絡安全應用中,實現了較好的檢測效果。由于機器學習、特別是深度學習模型決策過程復雜,對使用者而言具有不透明性和黑盒不可解釋性,導致這些智能系統的決策過程封閉,安全操作人員和專家無法參與進決策過程并提供專家知識反饋。
目前,機器學習、特別是深度學習技術為眾多網絡安全應用提供了全新的解決方案,顯著提高了檢測精度。與使用人工智能技術的其他領域(如圖像處理、語音識別)不同,安全領域處理數據復雜、錯誤容忍度低、專家知識要求高,這就要求安全應用應該有專家知識的參與和操作人員的判斷(即human-in-the-loop),而不應該是一個全自動化的系統。然而,由于深度學習模型的透明性和可解釋性差,專家參與決策過程面臨著如下挑戰:一方面,由于模型的可解釋性差,安全操作人員很難理解模型的決策過程,如果決策過程和結果都無法理解,反饋和知識融入也就無從談起;另一方面,由于模型的透明性差,解釋專家想要提供反饋,也不知道如何修改模型進行知識融入。
目前,“知識蒸餾”技術被廣泛應用在模型壓縮和遷移學習中,其主要思想是通過一步一步地使用一個較大的已經訓練好的網絡去知道訓練一個較小的網絡,通過蒸餾和提煉復雜模型中的核心知識來降低模型復雜度,提高模型可用性。模型蒸餾方法也被用于提高模型的可解釋性上,比如將可解釋性差的模型蒸餾成一個可以解釋的簡單模型(如決策樹)。然而,人工智能領域的知識蒸餾技術是將復雜模型蒸餾成一個新的簡單模型,解決了對原有模型的理解和解釋,本質上并沒有解決如何將專家知識和反饋融入到模型中的問題,雖然蒸餾后的簡單模型透明性強,理論上可以對新模型進行修改,但蒸餾到新模型的過程不可避免的帶來了精度的損失;此外,多數蒸餾后的模型(如決策樹)無法很好的支持在線更新,需要進行額外的處理才能適配,增加了模型的復雜程度和安全人員的操作難度。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,為了解決已有方法的缺陷,本發明提出了一種新的支持在線反饋的模型蒸餾方法。和人工智能領域的知識蒸餾方法有所不同,本發明中“知識蒸餾”中的“知識”不僅指復雜模型的知識,還包括專家知識(反饋)。同時,本發明不對原始深度學習模型進行修改,也不完全使用新的蒸餾模型進行檢測,而是將蒸餾方法作為原模型的一個后置的“插件”,即保證了原模型的檢測效果,又有很好的通用性。
本發明的另一個目的在于提出一種在線反饋的知識蒸餾裝置。
為達到上述目的,本發明一方面實施例提出了一種在線反饋的知識蒸餾方法,所述方法包括:
基于兩個狀態機設計蒸餾模型,以構成決策系統,其中,第一個狀態機表示模型決策結果,第二個狀態機關聯所述模型決策結果和專家反饋狀態;
根據所述蒸餾模型將在線蒸餾過程分為兩個階段:更新階段和測試階段;其中,所述更新階段將更新后的專家反饋融入所述決策系統中,所述測試階段將所述蒸餾模型作為插件和原始模型一起參與決策。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111045792.0/2.html,轉載請聲明來源鉆瓜專利網。





