[發(fā)明專利]基于決策樹的數(shù)據(jù)地圖生成方法、裝置和計(jì)算機(jī)設(shè)備在審
| 申請?zhí)枺?/td> | 201811535040.0 | 申請日: | 2018-12-14 |
| 公開(公告)號(hào): | CN109784370A | 公開(公告)日: | 2019-05-21 |
| 發(fā)明(設(shè)計(jì))人: | 陳麗;鄭昊敏 | 申請(專利權(quán))人: | 中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;H04L29/06 |
| 代理公司: | 深圳市明日今典知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市福田區(qū)益田路*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 流量數(shù)據(jù) 決策樹 數(shù)據(jù)地圖 異常流量 計(jì)算機(jī)設(shè)備 分類結(jié)果 流量類別 正常流量 預(yù)設(shè) 地理位置 存儲(chǔ)介質(zhì) 樣本數(shù)據(jù) 預(yù)警 關(guān)聯(lián) 輸出 分類 申請 | ||
1.一種基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,包括:
獲取第一流量數(shù)據(jù),所述第一流量數(shù)據(jù)包括所述第一流量的地理位置;
將所述第一流量數(shù)據(jù)輸入預(yù)設(shè)的流量決策樹進(jìn)行分類,其中所述流量決策樹基于流量數(shù)據(jù),以及與流量數(shù)據(jù)關(guān)聯(lián)的流量類別組成的樣本數(shù)據(jù)訓(xùn)練而成,所述流量類別包括異常流量或正常流量;
輸出所述第一流量的分類結(jié)果;
根據(jù)所述分類結(jié)果,在預(yù)設(shè)的地圖中的所述第一流量的地理位置處進(jìn)行特殊標(biāo)記,獲得所述數(shù)據(jù)地圖。
2.根據(jù)權(quán)利要求1所述的基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,所述流量決策樹的獲得方法,包括:
獲取指定量的樣本數(shù)據(jù),并將樣本數(shù)據(jù)分成訓(xùn)練集和測試集;其中,所述樣本數(shù)據(jù)包括流量數(shù)據(jù),以及與流量數(shù)據(jù)關(guān)聯(lián)的流量類別組成的樣本數(shù)據(jù);
將訓(xùn)練集的樣本數(shù)據(jù)輸入到CHAID決策樹模型中進(jìn)行訓(xùn)練,得到初步CHAID決策樹;
利用所述測試集的樣本數(shù)據(jù)驗(yàn)證所述初步CHAID決策樹;
如果驗(yàn)證通過,則將所述初步CHAID決策樹記為所述流量決策樹。
3.根據(jù)權(quán)利要求2所述的基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,所述將訓(xùn)練集的樣本數(shù)據(jù)輸入到CHAID決策樹模型中進(jìn)行訓(xùn)練,得到初步CHAID決策樹的步驟,包括:
設(shè)置所述CHAID決策樹模型的建模標(biāo)準(zhǔn)參數(shù),所述建模標(biāo)準(zhǔn)參數(shù)包括決策樹的最大層數(shù)、母節(jié)點(diǎn)的可再分的顯著水平、母節(jié)點(diǎn)包含的最小樣本數(shù)和子節(jié)點(diǎn)包含的最小樣本數(shù);
將訓(xùn)練集的樣本數(shù)據(jù)輸入到采用卡方自動(dòng)交互檢測法建立的所述CHAID決策樹模型中進(jìn)行訓(xùn)練,得到初步CHAID決策樹。
4.根據(jù)權(quán)利要求1所述的基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,所述流量決策樹的獲得方法,包括:
獲取指定量的樣本數(shù)據(jù)作為測試集;其中,所述樣本數(shù)據(jù)包括流量數(shù)據(jù),以及與流量數(shù)據(jù)關(guān)聯(lián)的流量類別組成的樣本數(shù)據(jù);
以已經(jīng)訓(xùn)練完成的CHAID決策樹作為初步CHAID決策樹,其中所述已經(jīng)訓(xùn)練完成的CHAID決策樹的訓(xùn)練數(shù)據(jù)的預(yù)測變量及目標(biāo)變量,與所述樣本數(shù)據(jù)的預(yù)測變量及目標(biāo)變量完全相同;
利用所述測試集的樣本數(shù)據(jù)驗(yàn)證所述初步CHAID決策樹;
如果驗(yàn)證通過,則將所述初步CHAID決策樹記為所述流量決策樹。
5.根據(jù)權(quán)利要求1所述的基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,所述根據(jù)所述分類結(jié)果,在預(yù)設(shè)的地圖中的所述第一流量的地理位置處進(jìn)行特殊標(biāo)記,獲得所述數(shù)據(jù)地圖的步驟,包括:
若所述分類結(jié)果為異常流量,則在預(yù)設(shè)的地圖中的所述異常流量的地理位置采用第一顏色進(jìn)行標(biāo)記;
若所述分類結(jié)果為正常流量,則在預(yù)設(shè)的地圖中的所述正常流量的地理位置采用第二顏色進(jìn)行標(biāo)記,獲得所述數(shù)據(jù)地圖。
6.根據(jù)權(quán)利要求5所述的基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,所述若所述分類結(jié)果為異常流量,則在預(yù)設(shè)的地圖中的生成所述異常流量的地理位置采用第一顏色進(jìn)行標(biāo)記的步驟之后,還包括:
在指定時(shí)間后,獲取在所述異常流量的地理位置上發(fā)送的第二流量數(shù)據(jù);
將所述第二流量數(shù)據(jù)輸入所述流量決策樹進(jìn)行分類;
若所述第二流量的分類結(jié)果為異常流量,在預(yù)設(shè)的地圖中的所述異常流量的地理位置上標(biāo)注特殊形狀。
7.根據(jù)權(quán)利要求1所述的基于決策樹的數(shù)據(jù)地圖生成方法,其特征在于,所述獲取第一流量數(shù)據(jù),所述第一流量數(shù)據(jù)包括所述第一流量的地理位置的步驟,包括:
接收第一流量的訪問請求;
對(duì)所述第一流量進(jìn)行分析,以獲取所述第一流量的IP地址與所述第一流量的注冊信息;
根據(jù)所述第一流量的IP地址確定所述第一流量的地理位置,根據(jù)所述第一流量的注冊信息確定所述第一流量數(shù)據(jù)的注冊時(shí)長、訪問時(shí)長、訪問頁面數(shù)、是否購買過保險(xiǎn)、對(duì)應(yīng)用戶的性別和對(duì)應(yīng)用戶的年齡數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司,未經(jīng)中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811535040.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 交互式電子地圖裝置及其實(shí)現(xiàn)方法
- 地圖描繪設(shè)備、導(dǎo)航裝置、地圖描繪方法、地圖描繪程序、以及用于記錄地圖描繪程序的信息記錄介質(zhì)
- 地圖數(shù)據(jù)更新系統(tǒng)以及地圖數(shù)據(jù)更新方法
- 導(dǎo)航裝置、切換參照地圖數(shù)據(jù)的方法、和計(jì)算機(jī)可讀介質(zhì)
- 基于地圖數(shù)據(jù)的處理方法、導(dǎo)航系統(tǒng)服務(wù)器以及導(dǎo)航系統(tǒng)
- 地圖信息管理系統(tǒng)
- 一種地圖數(shù)據(jù)檢查的方法及裝置
- 地圖數(shù)據(jù)的處理方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 地圖數(shù)據(jù)重構(gòu)方法及其裝置、記錄介質(zhì)
- 用于并行處理地圖數(shù)據(jù)的方法和裝置
- 基于數(shù)據(jù)流行為分析的網(wǎng)絡(luò)訪問異常檢測裝置及方法
- 一種DDOS攻擊動(dòng)態(tài)閾值異常流量檢測方法及裝置
- 網(wǎng)站流量異常檢測方法及系統(tǒng)
- 一種網(wǎng)絡(luò)流量異常檢測方法及系統(tǒng)
- 異常網(wǎng)絡(luò)流量檢測方法、可讀存儲(chǔ)介質(zhì)和終端
- 異常網(wǎng)絡(luò)流量檢測裝置
- 一種異常流量類型保留方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種用于對(duì)電網(wǎng)終端通信流量異常進(jìn)行檢測的方法及系統(tǒng)
- 一種電力無線專網(wǎng)異常流量分析阻斷方法及系統(tǒng)
- 網(wǎng)絡(luò)異常流量檢測方法及裝置





