[發明專利]基于機器學習模型解釋來分析數據的方法及裝置有效
| 申請號: | 201810683818.6 | 申請日: | 2018-06-28 |
| 公開(公告)號: | CN108960434B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 方榮;李福龍;楊慧斌;詹鎮江 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 王秀君;魯恭誠 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 機器 學習 模型 解釋 分析 數據 方法 裝置 | ||
1.一種基于機器學習模型解釋來分析數據的方法,包括:
獲取并顯示模型解釋內容,所述模型解釋內容包括模型結構解釋、模型特征重要性和模型預測解釋中的至少一種;
接收用戶針對所述模型解釋內容所顯示的特征名中的至少一個特征名作出的數據分析請求;
分別計算所述至少一個特征名中的每個特征名下所有特征在訓練樣本中的數據分布;以及
以可視化方式輸出所述數據分布。
2.如權利要求1所述的方法,其中,對于離散特征,所述數據分布為按照標記分組后的關于每個分組下的特征出現情況的堆疊柱狀圖、分組柱狀圖和/或散點圖。
3.如權利要求1所述的方法,其中,對于連續特征,所述數據分布為對按標記分組后的特征進行統計而獲得的平均值圖、點線圖和/或核密度估計圖。
4.如權利要求1所述的方法,其中,所述模型為邏輯回歸模型,并且,所述模型結構解釋被顯示為特征名、同一特征名下各個特征的權重值的分布信息和/或同一特征名下各個特征的維度信息。
5.如權利要求4所述的方法,其中,通過箱線圖來分別表示同一特征名下各個特征的非零權重值和/或全部權重值的分布信息,其中,所述箱線圖包括以下項中的至少一項:最小值、第一四分位數、中位數、第三四分位數和最大值。
6.如權利要求4所述的方法,其中,所述維度信息指示以下項中的至少一項:(1)同一特征名下權重值非零的特征的數量相對于所述同一特征名下的特征總數的占比;(2)同一特征名下所有特征的維度數和/或所述維度數相對于模型的特征總維度數的占比;(3)同一特征名下權重值非零的特征的維度數和/或所述維度數相對于模型的所有權重值非零的特征總維度數的占比。
7.如權利要求1所述的方法,其中,所述模型為邏輯回歸模型,并且,所述模型預測解釋被顯示為預測樣本的特征及其對應的權重;或者,所述模型為決策樹模型,并且,所述模型預測解釋被顯示為預測樣本的決策路徑及其對應的權重。
8.如權利要求1所述的方法,其中,所述數據分析請求包括:針對模型解釋內容所顯示的特征名中的所述至少一個特征名作出的懸停操作或點擊操作。
9.如權利要求1所述的方法,還包括:
接收特征名搜索指令;
根據所述特征名搜索指令在所述模型解釋內容所顯示的特征名中搜索目標特征名;
顯示搜索到的目標特征名以及對應的數據分布。
10.如權利要求1所述的方法,其中,以可視化方式輸出所述數據分布的步驟包括:通過建立模型解釋內容與所述數據分布的關聯性來顯示所述數據分布。
11.如權利要求1所述的方法,其中,以可視化方式輸出所述數據分布的步驟包括:將所述數據分布顯示在模型解釋內容附近。
12.一種基于機器學習模型解釋來分析數據的裝置,包括:
模型解釋單元,用于獲取并顯示模型解釋內容,所述模型解釋內容包括模型結構解釋、模型特征重要性和模型預測解釋中的至少一種;
接收單元,用于接收用戶針對所述模型解釋內容所顯示的特征名中的至少一個特征名作出的數據分析請求;
計算單元,用于分別計算所述至少一個特征名中的每個特征名下所有特征在訓練樣本中的數據分布;以及
輸出單元,用于以可視化方式輸出所述數據分布。
13.如權利要求12所述的裝置,其中,對于離散特征,所述數據分布為按照標記分組后的關于每個分組下的特征出現情況的堆疊柱狀圖、分組柱狀圖和/或散點圖。
14.如權利要求12所述的裝置,其中,對于連續特征,所述數據分布為對按標記分組后的特征進行統計而獲得的平均值圖、點線圖和/或核密度估計圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810683818.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于運行機器學習建模過程的方法及系統
- 下一篇:量子糾纏態的探測系統及方法





