[發明專利]一種基于Xgboost集成學習的物聯終端類型識別方法在審
| 申請號: | 202210952144.1 | 申請日: | 2022-08-09 |
| 公開(公告)號: | CN115510041A | 公開(公告)日: | 2022-12-23 |
| 發明(設計)人: | 沈健;張磊;袁譽峰;錢一宏;張永建;胡利輝;張曉峰;周金邢;施光南;蔣安杰;韓保禮;王雪穎 | 申請(專利權)人: | 國網浙江省電力有限公司紹興供電公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06N20/20;G06Q50/06;G16Y10/35;G16Y20/20 |
| 代理公司: | 杭州華鼎知識產權代理事務所(普通合伙) 33217 | 代理人: | 王旭峰 |
| 地址: | 312099 *** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 xgboost 集成 學習 終端 類型 識別 方法 | ||
1.一種基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:包括如下步驟:
S1.1:對數據進行終端識別,基于流處理,通過以MAC為中心的設備唯一識別方法,識別出網絡中的終端,并賦予唯一的ID;
S1.2:進行終端類型識別,通過特征提取、特征篩選、特征轉換、類型預測,識別出終端的類型;
S1.3:進行縱向行為畫像,在時間的維度,對終端的公共行為、特殊行為進行畫像:
S1.4:進行橫向行為畫像,以相同類型的終端行為為基準,對比當前終端的行為。
2.根據權利要求1所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述步驟S1.2中,所述特征提取包括數據清洗、數據規范化和特征衍生與提取。
3.根據權利要求1所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述步驟S1.2中,所述特征篩選采用過濾法、包裝法和嵌入法。
4.根據權利要求1所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:通過對比模型對特征分布的要求、模型的魯棒性、模型的資源消耗情況、模型的可更新性、模型的樣本外準確率,選擇基于Boosting和樹形模型的XGBoost模型。
5.根據權利要求4所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述XGBoost模型流程如下:
S2.1:判斷是否有主動掃描任務,判斷的同時進行旁路解析生成流量日志;若有主動掃描任務,則根據用戶指定IP范圍,通過主動掃描任務獲取更多設備信息并生成日志,否則采集日志數據,生成日志流并送入流處理模型;
S2.2:判斷設備是否存在,設備存在則生成設備信息并形成設備行為畫像,設備不存在則更新設備信息和設備行為畫像;同時對機器學習進行在線學習、改變模型成熟度∝d;
S2.3:設備行為畫像進入設備畫像流處理模塊獲得pd,設備行為畫像進入機器學習流處理模塊獲得qd;
S2.4:得到最終判定rd。
6.根據權利要求5所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述步驟S2.3中,qd形成數據反饋至模型成熟度∝d。
7.根據權利要求5所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述步驟S2.4中,rd形成用戶反饋至模型成熟度∝d。
8.根據權利要求5所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述模型建立完成后,將終端行為畫像送入訓練好的模型中,預測終端的類型,取概率最大的類型識別為終端的類型。
9.根據權利要求8所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:當模型判斷的終端類型與用戶的預期不符時,用戶通過在交互頁面上簡單地更新終端的類型,修正該終端的類型,同時更新模型。
10.根據權利要求9所述的基于Xgboost集成學習的物聯終端類型識別方法,其特征在于:所述模型更新邏輯如下:
S3.1:判斷用戶是否更新了終端的類型;若用戶更新了終端類型,記錄該設備不同時間段的行為畫像;
S3.2:當行為畫像數據積累到一定程度,在原模型的基礎上,進一步訓練模型,且提高最新行為畫像數據的權重;
S3.3:保存訓練好的新模型,并將新模型應用到后續的預測中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網浙江省電力有限公司紹興供電公司,未經國網浙江省電力有限公司紹興供電公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210952144.1/1.html,轉載請聲明來源鉆瓜專利網。





