[發(fā)明專利]一種深度學習模型個體預測解釋方法在審
| 申請?zhí)枺?/td> | 202010148007.3 | 申請日: | 2020-03-05 |
| 公開(公告)號: | CN111353603A | 公開(公告)日: | 2020-06-30 |
| 發(fā)明(設計)人: | 孫兆悅 | 申請(專利權)人: | 深圳索信達數(shù)據(jù)技術有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N7/00;G06N20/10 |
| 代理公司: | 深圳市千納專利代理有限公司 44218 | 代理人: | 黃良寶 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 學習 模型 個體 預測 解釋 方法 | ||
一種深度學習模型個體預測解釋方法,涉及數(shù)據(jù)建模后對個體預測結果的解釋與分析。包括步驟:S1,對原始個體樣本數(shù)據(jù)進行清洗和預處理;S2,將個體樣本數(shù)據(jù)放入深度學習模型中建模,得到預測模型y1=f(x);S3,選取一個待解釋個體樣本,獲取該樣本取值x*,并計算出預測模型對該樣本的預測值S4,將x*作為解釋變量、作為響應變量,輸出一個擬合的可解釋模型y2=g(x);S5,通過分析可解釋模型y2=g(x)的參數(shù),若參數(shù)為正,則表示該特征對個體預測結果輸出值有增益作用;若參數(shù)為負,則表示該特征對個體預測結果輸出值有消減作用;解決深度模型無法對個體預測結果進行解釋的問題,提高了模型預測的準確性和可信度。
技術領域
本發(fā)明涉及數(shù)據(jù)分析領域,具體涉及數(shù)據(jù)建模后對個體預測結果的解釋與分析。
背景技術
數(shù)據(jù)建模是數(shù)據(jù)分析中重要的一個環(huán)節(jié),建立高精度的預測模型能夠有效提升決策的正確性。目前隨著人工智能領域的不斷發(fā)展,越來越多企業(yè)、高校和個體選用深度學習模型進行高精度的預測。然而深度學習模型由于其內(nèi)部結構過于復雜,針對模型預測結果的解釋方法僅限于全局解釋,即通過“特征重要性”指標來反映每個特征變量對模型整體的貢獻程度。但該方法無法對個體預測結果進行說明,無法計算并反映出每個特征變量對個體結果的貢獻程度,從而使得模型預測透明性和預測準確性被限制。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有深度學習模型對個體預測缺乏解釋性的問題,提出一種深度學習模型個體預測解釋方法。該方法是一種靈活性極高的模型事后解析方法,通過構建線性模型進行局部擬合,能夠針對深度學習模型的個體預測結果進行解釋,計算出每個特征對個體預測結果的貢獻度,從而提升個體預測的可信度和精確性。
為了解決本發(fā)明所提出的問題,采用的技術方案為:一種深度學習模型個體預測解釋方法,其特征在于:包括以下步驟:
S1,對個體樣本數(shù)據(jù)進行清洗和預處理;對數(shù)據(jù)進行一致性檢查,刪除錯誤數(shù)據(jù)或無效數(shù)據(jù),并進行缺失值填充;將分類變量轉化為數(shù)值型變量;
S2,將個體樣本數(shù)據(jù)放入深度學習模型中建模,得到預測模型y1=f(x);
S3,選取-個待解釋個體樣本,獲取該樣本取值x*,并計算出預測模型對該樣本的預測值
S4,將x*作為解釋變量、作為響應變量,運用本方法輸出一個擬合的可解釋模型y2=g(x);
S5,通過分析可解釋模型y2=g(x)的參數(shù),獲知該目標樣本中每個特征對結果的貢獻程度:若參數(shù)為正,則表示該特征對個體預測結果輸出值有增益作用;若參數(shù)為負,則表示該特征對個體預測結果輸出值有消減作用;參數(shù)絕對值越大,該特征對個體預測結果的影響越大;由此,作為深度學習模型對個體預測的解釋方法。
作為本發(fā)明進一步限定的技術方案包括有:
所述步驟S4的方法包括以下步驟:
1)在目標樣本x*的一個鄰域(-3σ,3σ)(其中σ為總體方差)內(nèi)產(chǎn)生一些隨機樣本:對于連續(xù)性變量,在目標樣本x*的鄰域內(nèi)使用標準正態(tài)分布產(chǎn)生一系列新的指定個數(shù)的隨機樣本Z={z1,z2,z3,...,zn},其中n為樣本量;對于離散型變量,在目標樣本的鄰域內(nèi)根據(jù)其本身特征分布進行隨機取樣;
2)給新生成的樣本打標簽:將新生成樣本點Z,放入已訓練出的預測模型f(x)中進行預測,得到f(Z)={f(z1),f(z2),f(z3),...,f(zn)};
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳索信達數(shù)據(jù)技術有限公司,未經(jīng)深圳索信達數(shù)據(jù)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010148007.3/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





