[發明專利]決策樹模型構建及應用方法、裝置和相關設備在審
| 申請號: | 202210872692.3 | 申請日: | 2022-07-21 |
| 公開(公告)號: | CN115115004A | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 錢學廣 | 申請(專利權)人: | 中國平安財產保險股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N5/00;G06N20/00 |
| 代理公司: | 深圳國新南方知識產權代理有限公司 44374 | 代理人: | 周雷 |
| 地址: | 518000 廣東省深圳市福田區益田路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 決策樹 模型 構建 應用 方法 裝置 相關 設備 | ||
本申請公開了一種決策樹模型構建及應用方法、裝置和相關設備,應用于數據挖掘領域。本申請提供的決策樹模型構建方法包括:根據目標業務的數據挖掘需求,確定所述目標業務的目標結果數據屬性,并獲取所述目標業務的歷史數據,得到目標數據集;計算所述目標數據集的數據集信息熵,計算所述目標數據集中每個類別屬性的屬性信息熵;計算所述每個類別屬性的屬性信息增益;計算所述每個類別屬性的屬性信息增益率;將所述屬性信息增益率最大的類別屬性作為分裂屬性,并將所述分裂屬性對應的各屬性值作為決策樹的葉子節點;循環處理所述目標數據集中剩余每個類別屬性,直至所述目標數據集中的每個類別屬性都被分裂,得到構建完成的決策樹模型。
技術領域
本申請涉及數據挖掘領域,尤其涉及一種決策樹模型構建及應用方法、裝置和相關設備。
背景技術
在平臺技術發展的大背景下,各種平臺會對接外部的第三方合作伙伴,平臺在與該第三方合作伙伴進行業務對接的過程中,該第三方合作伙伴通過平臺提供的開放接口產生了大量業務歷史數據,由此產生了如何通過業務歷史數據去辨別優質第三方合作伙伴的問題。
傳統的數據庫查詢、報表統計等方式不僅復雜、低效且分析誤差大,無法發現數據中潛在的關聯關系,也無法根據歷史數據生成精準的預測結果。
發明內容
本申請實施例提供一種決策樹模型構建及應用方法、裝置和相關設備,以解決現有技術中無法根據歷史數據生成目標業務的精準預測結果的問題。
本申請的第一方面,提供一種決策樹模型構建方法,包括:
根據目標業務的數據挖掘需求,確定所述目標業務的目標結果數據屬性,并獲取與所述目標結果數據屬性關聯的所述目標業務的歷史數據,得到目標數據集;
根據預設第一信息熵公式計算所述目標數據集的數據集信息熵,根據預設第二信息熵公式計算所述目標數據集中每個類別屬性的屬性信息熵;
根據所述每個類別屬性的屬性信息熵,以及預設信息增益公式,計算所述每個類別屬性的屬性信息增益;
根據預設分裂信息公式計算所述每個類別屬性的屬性分裂信息;
根據所述屬性信息增益和所述屬性分裂信息,以及預設信息增益公式,計算所述每個類別屬性的屬性信息增益率;
將所述屬性信息增益率最大的類別屬性作為分裂屬性,并將所述分裂屬性對應的各屬性值作為決策樹的葉子節點,以及從所述目標數據集中移除所述分裂屬性;
循環處理所述目標數據集中剩余每個類別屬性,并將所述剩余每個類別屬性作為下一級分裂屬性,以及將所述下一級分裂屬性的各屬性值作為所述決策樹的下一級葉子節點,直至所述目標數據集中的每個類別屬性都被分裂,得到構建完成的決策樹模型。
本申請的第二方面,提供一種決策樹模型應用方法,包括:
從目標業務對應的數據庫以及所述目標業務對應的第三方渠道獲取所述目標業務的歷史數據,并篩選得到與所述決策樹模型匹配的目標歷史數據;
發送所述目標歷史數據至所述決策樹模型,輸出對所述目標業務的預測結果數據;
根據所述預測結果數據,以及預設優化調整方法,優化調整所述目標業務;
其中,所述決策樹模型是根據前述的決策樹模型構建方法進行構建得到的。
本申請的第三方面,提供一種決策樹模型構建裝置,包括:
目標數據集模塊,用于根據目標業務的數據挖掘需求,確定所述目標業務的目標結果數據屬性,并獲取與所述目標結果數據屬性關聯的所述目標業務的歷史數據,得到目標數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安財產保險股份有限公司,未經中國平安財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210872692.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種懸索橋吊索的快捷更換和檢測系統
- 下一篇:一種結核病房唾液收集隔離裝置





