[發明專利]一種解釋保險核保分類結果的方法、裝置有效
| 申請號: | 202010467745.4 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111652302B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 韓森堯;喻廬軍;劉巖;王若楠 | 申請(專利權)人: | 泰康保險集團股份有限公司 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06Q40/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 柴燕梅 |
| 地址: | 100031 北京市西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 解釋 保險 分類 結果 方法 裝置 | ||
1.一種解釋保險核保分類結果的方法,其特征在于,包括:
將至少一個測試樣本、至少一個訓練樣本和至少兩個擴充樣本帶入預測模型,得到所述至少一個測試樣本中每個測試樣本的預測值f(xtest)、所述至少一個訓練樣本中每個訓練樣本的預測值f(Xtrain)和所述至少兩個擴充樣本中每個擴充樣本的預測值f(Xexpand);其中,一個樣本表征一個用戶的體檢數據,所述體檢數據包括多個測試項目以及每個測試項目的值,所述預測值表征每個樣本的保險核保的分類結果,所述預測模型為用于對樣本進行保險核保分類的神經網絡模型,所述訓練樣本為訓練所述神經網絡模型時用的樣本;
計算每一種分類結果下的所有擴充樣本的平均預測值E(f(Xexpand))、所有訓練樣本的平均預測值E(f(Xtrain));計算所述每一種分類結果下的所述所有擴充樣本的平均預測值E(f(Xexpand))和所述所有訓練樣本平均預測值E(f(Xtrain))的殘差R1、所述所有擴充樣本的平均預測值E(f(Xexpand))和所有測試樣本預測值f(xtest)的殘差R2;計算所述每一種分類結果下殘差R1和殘差R2的向量和R=(R1,R2);
將所述每一種分類結果對應的向量和R=(R1,R2)輸入邏輯回歸模型進行計算,獲得所述每一種分類結果對應的重要測試項目;
基于所述每一種分類結果對應的重要測試項目輸出所述每一種分類結果的解釋信息;
所述每一種分類結果的解釋信息包括:所述每一種分類結果對應的重要測試項目對該分類結果的貢獻度。
2.如權利要求1所述的方法,其特征在于,所述保險核保的類型包括延期、拒保、標準或次標準中的至少一項。
3.如權利要求1所述的方法,其特征在于,所述測試項目包括:身高、年齡、性別、肝功能、血脂、性別、血常規、婦科、血糖、胸透、心電圖、內科、外科、乙肝五項、收縮壓、舒張壓、裸眼視力、體重、吸煙指數、心率、B超、身體質量指數BMI。
4.如權利要求1-3中任一項所述的方法,其特征在于,在將至少一個測試樣本、至少一個訓練樣本和至少兩個擴充樣本帶入預測模型之前,所述方法還包括:
獲取所述至少一個測試樣本中的任一個測試樣本的S個特征變量其中S={1,2,…,s};
獲取所述至少一個訓練樣本中的任一個訓練樣本的S個特征變量
隨機生成t個掩碼序列,其中,每個掩碼序列表示為Mt=(m1,m2,…,ms),其中,隨機使得其中t為大于0的整數,i為大于0且小于s的整數;
基于一個測試樣本和一個掩碼序列對所述至少一個訓練樣本中每個訓練樣本進行擴充,獲得所述至少兩個擴充樣本。
5.如權利要求4所述的方法,其特征在于,將所述每一種分類結果對應的向量和R=(R1,R2)輸入邏輯回歸模型進行計算,獲得所述每一種分類結果對應的重要測試項目,具體包括:
將所述每一種分類結果對應的向量和R=(R1,R2)作為輸入量yi帶入所述邏輯回歸模型進行計算,獲得所述每一種分類結果對應樣本的每個測試項目的擬合系數,其中,所述擬合系數表征所述每一種分類結果對應樣本的測試項目的重要度,xi為加權后的掩碼矩陣,所述掩碼矩陣為所述t個掩碼序列中的至少一個掩碼序列組成的矩陣,為L1正則項,λ為正則項的超參數,λ>0;
選取系數不為0的至少一個測試項目作為至少一個重要測試項目。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司,未經泰康保險集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010467745.4/1.html,轉載請聲明來源鉆瓜專利網。





