[發明專利]一種報銷單風險預測方法、裝置、終端設備及存儲介質在審
| 申請號: | 201810161565.6 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN108364106A | 公開(公告)日: | 2018-08-03 |
| 發明(設計)人: | 袁軍;陸源;魏堯東 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q40/00 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 陽開亮 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預測 成功率 訓練樣本 測試樣本 風險預測 預測模型 組合方式 預設 關聯規則算法 測試 存儲介質 風險級別 回歸分析 模型參數 模型訓練 目標預測 樣本數據 終端設備 組模型 準確率 | ||
1.一種報銷單風險預測方法,其特征在于,所述報銷單風險預測方法包括:
獲取歷史報銷單信息,并將所述歷史報銷單信息作為樣本數據;
將所述樣本數據按照預設的比例劃分為訓練樣本和測試樣本;
根據預設的N個報銷單風險等級的定義,確定每個所述訓練樣本的報銷單風險等級,其中,N為正整數;
針對每個所述報銷單風險等級中的所述訓練樣本,使用關聯規則算法進行模型訓練,得到初始預測模型,其中,所述初始預測模型包括每個所述報銷單風險等級中滿足預設的模型參數要求的關聯規則,所述模型參數包括支持度和置信度;
使用所述初始預測模型對所述測試樣本進行模型預測,在從每個所述報銷單風險等級中選擇一組所述模型參數進行組合得到的每種組合方式下,計算每個所述報銷單風險等級的預測成功率,以及每種所述組合方式下的總預測成功率和測試時間;
對所述模型參數、所述預測成功率、所述測試時間和所述總預測成功率進行回歸分析,得到目標預測模型。
2.如權利要求1所述的報銷單風險預測方法,其特征在于,所述針對每個所述報銷單風險等級中的所述訓練樣本,使用關聯規則算法進行模型訓練,得到初始預測模型包括:
對每個所述報銷單風險等級中的所述訓練樣本進行數據預處理,得到每個所述報銷單風險等級中的待處理數據集;
對所述待處理數據集使用關聯規則算法進行數據挖掘,得到每個所述報銷單風險等級中的多個項集;
針對每個所述報銷單風險等級,從該報銷單風險等級中的所述項集中篩選出滿足所述模型參數要求的目標項集,并根據該目標項集建立關聯規則;
根據所述關聯規則和所述關聯規則對應的所述模型參數要求,構建所述初始預測模型。
3.如權利要求1或2所述的報銷單風險預測方法,其特征在于,所述使用所述初始預測模型對所述測試樣本進行模型預測,在從每個所述報銷單風險等級中選擇一組所述模型參數進行組合得到的每種組合方式下,計算每個所述報銷單風險等級的預測成功率,以及該組合方式下的總預測成功率和測試時間包括:
根據所述預設的N個報銷單風險等級的定義,確定每個所述測試樣本的報銷單風險等級,以及每個所述報銷單風險等級的測試樣本數;
按照如下公式計算所述測試樣本中每個報銷單風險等級的概率:
其中,i∈[1,N],Pi為所述測試樣本中第i個報銷單風險等級的概率,Ri為第i個所述報銷單風險等級的測試樣本數,S為所述測試樣本的總數;
從每個所述報銷單風險等級中選擇一組所述模型參數進行組合,得到L種組合方式,其中,L為正整數;
針對每種所述組合方式,按照所述概率由高到低的順序,使用所述初始預測模型對所述測試樣本進行報銷單風險等級預測,得到每個所述測試樣本的預測結果,并獲取在該組合方式下的進行報銷單風險等級預測的測試時間;
將每個所述測試樣本的所述預測結果與該測試樣本的報銷單風險等級進行對比,若兩者相同則確認該測試樣本預測成功,并統計在每種所述組合方式下每個所述報銷單風險等級下的測試樣本預測成功的個數;
按照如下公式計算每種所述組合方式下每個所述報銷單風險等級的預測成功率:
其中,hitratei為第i個所述報銷單風險等級的預測成功率,Mi為第i個所述報銷單風險等級下的測試樣本預測成功的個數;
按照如下公式計算每種所述組合方式下的總預測成功率:
其中,hitRate為所述總預測成功率。
4.如權利要求3所述的報銷單風險預測方法,其特征在于,所述對所述模型參數、所述預測成功率、所述測試時間和所述總預測成功率進行回歸分析,得到目標預測模型包括:
將每個所述報銷單風險等級中的所述模型參數,以及所述預測成功率和所述測試時間作為設計變量,將所述總預測成功率作為目標變量,使用所述設計變量和所述目標變量進行函數擬合,得到擬合函數;
對所述擬合函數進行求解,根據求解結果將所述總預測成功率最高并且所述模型參數的值最高的一組設計變量作為模型配置參數,并根據所述模型配置參數構建目標預測模型,其中,所述目標預測模型的模型精確度為最高的所述總預測成功率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810161565.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種物流配送線路的目標優化方法
- 下一篇:一種投資數據處理方法及裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





