[發明專利]基于決策樹的數據地圖生成方法、裝置和計算機設備在審
| 申請號: | 201811535040.0 | 申請日: | 2018-12-14 |
| 公開(公告)號: | CN109784370A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 陳麗;鄭昊敏 | 申請(專利權)人: | 中國平安財產保險股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H04L29/06 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區益田路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 流量數據 決策樹 數據地圖 異常流量 計算機設備 分類結果 流量類別 正常流量 預設 地理位置 存儲介質 樣本數據 預警 關聯 輸出 分類 申請 | ||
本申請揭示了一種基于決策樹的數據地圖生成方法、裝置、計算機設備和存儲介質,所述方法包括:獲取第一流量數據,所述第一流量數據包括所述第一流量的地理位置;將所述第一流量數據輸入預設的流量決策樹進行分類,其中所述流量決策樹基于流量數據,以及與流量數據關聯的流量類別組成的樣本數據訓練而成,所述流量類別包括異常流量或正常流量;輸出所述第一流量的分類結果;根據所述分類結果,在預設的地圖中的所述第一流量的地理位置處進行特殊標記,獲得所述數據地圖。從而實現了自動準確區分正常流量與異常流量,并能夠對異常流量進行預警。
技術領域
本申請涉及到計算機領域,特別是涉及到一種基于決策樹的數據地圖生成方法、裝置、計算機設備和存儲介質。
背景技術
網絡活動中常以流量作為指標,來判斷例如網站活躍性、虛擬產品的受歡迎程度等,其中,若將所有的流量均作為判斷的基礎,無疑會使判斷的準確度受到影響,這是因為有些流量并非是有效流量,例如刷單、刷廣告等異常流量,會對以流量作為指標的判斷行為造成影響。
現有技術一般會用以下幾個指標來判斷虛假流量,如流量產生的時間;流量的地理位置;使用的網絡接入方式;跳出率;網站停留時間;進入路徑和點擊分布圖;目標的完成;pageviews(綜合瀏覽量)/unique pageviews(唯一身份綜合瀏覽量);訪客忠誠度分析(回訪頻率);訪客重合度分析;頁面訪問長尾分析等。但目前主要依靠單個指標進行人為分析,不能做到幾個指標同時進行綜合分析,其次,也不能有效輸出緊急程度的預警,再次,結果也不能直觀的展現。
發明內容
本申請的主要目的為提供一種基于決策樹的數據地圖生成方法、裝置、計算機設備和存儲介質,旨在解決現有技術中無法自動準確區分正常流量與異常流量的問題,以及無法對異常流量進行預警。
為了實現上述發明目的,本申請提出一種基于決策樹的數據地圖生成方法,包括以下步驟:
獲取第一流量數據,所述第一流量數據包括所述第一流量的地理位置;
將所述第一流量數據輸入預設的流量決策樹進行分類,其中所述流量決策樹基于流量數據,以及與流量數據關聯的流量類別組成的樣本數據訓練而成,所述流量類別包括異常流量或正常流量;
輸出所述第一流量的分類結果;
根據所述分類結果,在預設的地圖中的所述第一流量的地理位置處進行特殊標記,獲得所述數據地圖。
進一步地,所述流量決策樹的獲得方法,包括:
獲取指定量的樣本數據,并將樣本數據分成訓練集和測試集;其中,所述樣本數據包括流量數據,以及與流量數據關聯的流量類別組成的樣本數據;
將訓練集的樣本數據輸入到CHAID決策樹模型中進行訓練,得到初步CHAID決策樹;
利用所述測試集的樣本數據驗證所述初步CHAID決策樹;
如果驗證通過,則將所述初步CHAID決策樹記為所述流量決策樹。
進一步地,所述將訓練集的樣本數據輸入到CHAID決策樹模型中進行訓練,得到初步CHAID決策樹的步驟,包括:
設置所述CHAID決策樹模型的建模標準參數,所述建模標準參數包括決策樹的最大層數、母節點的可再分的顯著水平、母節點包含的最小樣本數和子節點包含的最小樣本數;
將訓練集的樣本數據輸入到采用卡方自動交互檢測法建立的所述CHAID決策樹模型中進行訓練,得到初步CHAID決策樹。
進一步地,所述流量決策樹的獲得方法,包括:
獲取指定量的樣本數據作為測試集;其中,所述樣本數據包括流量數據,以及與流量數據關聯的流量類別組成的樣本數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安財產保險股份有限公司,未經中國平安財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811535040.0/2.html,轉載請聲明來源鉆瓜專利網。





