[發明專利]一種機器學習可解釋方法、裝置及存儲介質在審
| 申請號: | 202011241293.4 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112561074A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 師圣;杜楊洲;范偉 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 周偉 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器 學習 可解釋 方法 裝置 存儲 介質 | ||
本發明公開了一種機器學習可解釋方法、裝置及計算機可讀存儲介質,首先獲取待解釋樣本;再基于所述待解釋樣本的特征相關性對所述待解釋樣本進行采樣,得到包括若干采樣值的采樣集;接著利用所述若干采樣值進行模型訓練,得到可解釋模型;最后利用所述可解釋模型對所述待解釋樣本進行解釋,得到解釋結果。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種機器學習可解釋方法、裝置及計算機可讀存儲介質。
背景技術
與模型無關的局部可解釋性算法(LIME,Local Interpretable Model-agnosticExplanations)的主要思想是利用可解釋性模型(如線性模型)局部近似目標黑盒模型的預測。LIME在局部采樣過程中采用了特征隨機采樣方式,即假設信號的特征之間是相互獨立的,采樣時隨機對特征進行抽取,這種采樣方式簡單又直觀。
然而,對于圖像、自然語言以及結構化數據來講,特征之間往往存在很強的相關性,如果采用特征隨機采樣方式會忽略特征相關性,必然損失大量有用信息,從而影響解釋結果的保真性和解釋性。
發明內容
本發明實施例為了解決LIME算法中采樣方案所存在的問題,創造性地提出了一種機器學習可解釋方法、裝置及計算機可讀存儲介質。
根據本發明第一方面,提供了一種機器學習可解釋方法,該方法包括:獲取待解釋樣本;基于所述待解釋樣本的特征相關性對所述待解釋樣本進行采樣,得到包括若干采樣值的采樣集;利用所述若干采樣值進行模型訓練,得到可解釋模型;利用所述可解釋模型對所述待解釋樣本進行解釋,得到解釋結果。
根據本發明一實施方式,所述待解釋樣本包括如下數據類型至少之一:圖像數據、自然語言及結構化數據。
根據本發明一實施方式,利用所述若干采樣值進行模型訓練,得到可解釋模型,包括:對所述若干采樣值進行線性擬合,得到線性模型;相應的,利用所述可解釋模型對所述待解釋樣本進行解釋,包括:通過分類器得到所述待解釋樣本的分類結果;利用所述線性模型對所述分類結果的進行解釋。
根據本發明一實施方式,所述待解釋樣本為原始圖像;基于所述待解釋樣本的特征相關性對所述待解釋樣本進行采樣,得到包括若干采樣值的采樣集,包括:對原始圖像進行圖像分割,得到超像素塊圖像;將超像素塊圖像轉化為無向圖;尋找所述無向圖中的所有團,所述團為無向圖中的一個子集,且所述子集中的任意兩個頂點都有邊相連。
根據本發明一實施方式,所述將超像素塊圖像轉化為無向圖,包括:將所述超像素塊圖像對應無向圖的頂點;若存在相鄰的兩個超像素塊圖像,則將無向圖中對應的兩個頂點通過無向邊相連。
根據本發明一實施方式,利用深度優化搜索算法尋找所述無向圖中的所有團。
根據本發明第二方面,還提供了一種機器學習可解釋裝置,所述裝置包括:獲取模塊,用于獲取待解釋樣本;相關性采樣模塊,用于基于所述待解釋樣本的特征相關性對所述待解釋樣本進行采樣,得到包括若干采樣值的采樣集;訓練模塊,用于利用所述若干采樣值進行模型訓練,得到可解釋模型;解釋模塊,用于利用所述可解釋模型對所述待解釋樣本進行解釋,得到解釋結果。
根據本發明一實施方式,所述訓練模塊,具體用于對所述若干采樣值進行線性擬合,得到線性模型;相應的,所述解釋模塊,還用于通過分類器得到所述待解釋樣本的分類結果;利用所述線性模型對所述分類結果的進行解釋。
根據本發明一實施方式,所述待解釋樣本為原始圖像;所述相關性采樣模塊具體用于,對原始圖像進行圖像分割,得到超像素塊圖像;將超像素塊圖像轉化為無向圖;尋找所述無向圖中的所有團,所述團為無向圖中的一個子集,且所述子集中的任意兩個頂點都有邊相連。
根據本發明一實施方式,所述相關性采樣模塊還用于,將所述超像素塊圖像對應無向圖的頂點;若存在相鄰的兩個超像素塊圖像,則將無向圖中對應的兩個頂點通過無向邊相連。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011241293.4/2.html,轉載請聲明來源鉆瓜專利網。





