[發明專利]基于樹模型的車險快速理賠方法和系統在審
| 申請號: | 202010177071.4 | 申請日: | 2020-03-13 |
| 公開(公告)號: | CN111260490A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 肖延國;戴杰;周忠球 | 申請(專利權)人: | 上海遠眸軟件有限公司 |
| 主分類號: | G06Q40/08 | 分類號: | G06Q40/08;G06N20/00 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 劉杰 |
| 地址: | 200000 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模型 車險 快速 理賠 方法 系統 | ||
1.一種基于樹模型的車險快速理賠方法,其特征在于,包括步驟:
數據的預處理,將車險理賠數據中的異常值和空值進行處理或填充;
數據集的構建,對上述預處理后的數據進行二分類,構成數據集;
特征的構建,根據不同的特征類型構建特征庫;
機器學習模型的構建,基于所述數據集和特征庫,使用XGBoost樹模型構建車險快速理賠模型;
模型的訓練,按照一定比例隨機抽取風險案件和正常案件,構造訓練集,根據訓練結果重新確定最優的正樣本和負樣本的比例。
2.如權利要求1所述的車險快速理賠方法,其特征在于,所述車險理賠數據包括投保人信息、車輛信息、保單信息和事故現場信息,所述數據的預處理步驟具體包括:
將不符合數據格式或長度的車險理賠數據判定為異常值,并將異常值和空值進行處理或填充,即,將車險理賠數據分為類別型數據和數值型數據,其中,類別型數據又分為二值化數據和多類別數據;
對于類別型數據,根據業務邏輯使用已存在的類別對異常值和空值進行填充,或把空值使用新的類別進行填充;異常值和空值填充后,類別型數據應全部歸屬于上述兩類中的一類;
對于數據值數據,使用均值或者中位數對異常值和空值進行填充。
3.如權利要求1所述的車險快速理賠方法,其特征在于,所述特征的構建步驟具體包括:
將所述特征類型分為類別型特征和數值型特征;
對于類別型特征,需先經特征編碼轉換成數值型特征,所述特征編碼包括標簽編碼和計數編碼,其中,
標簽編碼是指將某一特征的n種類別一一映射成1,2,……,n等自然數,其中,n≤10;
計數編碼是指將某一特征中屬于該類別的樣本數作為該類別的映射結果。
對于數值型特征,按以下方式處理:
分箱,將連續型數值進行離散化,使多個連續值變成較少數量的值;和
聚合,以類別特征為主鍵,計算屬于該類別特征的數值特征的均值和方差,將得到的結果作為特征構建特征庫。
4.如權利要求1所述的車險快速理賠方法,其特征在于,所述模型的訓練步驟具體包括:
抽取數據集中的全量正樣本,再按照一定比例隨機抽取負樣本,構造訓練集,根據模型的訓練結果重新確定正樣本和負樣本的比例,直至最優。
5.如權利要求1~4任一項中所述的車險快速理賠方法,其特征在于,還包括步驟:
模型的部署,將模型部署至云平臺并上傳訓練后的模型文件,供報案人線上提交理賠申請,并輸出最終的理賠結果。
6.一種基于樹模型的車險快速理賠系統,其特征在于,包括:
數據的預處理模塊,用于將車險理賠數據中的異常值和空值進行處理或填充;
數據集的構建模塊,用于對上述預處理后的數據進行二分類,構成數據集;
特征的構建模塊,用于根據不同的特征類型構建特征庫;
機器學習模型的構建模塊,用于基于所述數據集和特征庫,使用XGBoost樹模型構建車險快速理賠模型;
模型的訓練模塊,用于按照一定比例隨機抽取風險案件和正常案件,構造訓練集,根據訓練結果重新確定最優的正樣本和負樣本的比例。
7.如權利要求6所述的車險快速理賠系統,其特征在于,所述數據的預處理模塊進一步包括:
分類單元,用于將車險理賠數據分為類別型數據和數值型數據,其中,類別型數據又分為二值化數據和多類別數據;
數據處理單元,用于對于類別型數據,根據業務邏輯使用已存在的類別對異常值和空值進行填充,或把空值使用新的類別進行填充;異常值和空值填充后,類別型數據應全部歸屬于上述兩類中的一類;對于數據值數據,使用均值或者中位數對異常值和空值進行填充。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海遠眸軟件有限公司,未經上海遠眸軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010177071.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:橙花醇在制備防治陰道炎藥物中的應用
- 下一篇:一種制備硅化石墨結構材料的方法





