[發明專利]一種基于多分類器融合模型的網絡關系類型預測方法有效
| 申請號: | 201911414801.1 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111160483B | 公開(公告)日: | 2023-03-17 |
| 發明(設計)人: | 劉闖;于柿民;張子柯 | 申請(專利權)人: | 杭州師范大學 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/24;G06N20/00;G06Q50/00 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 楊舟濤 |
| 地址: | 311121 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分類 融合 模型 網絡 關系 類型 預測 方法 | ||
1.一種基于多分類器融合模型的網絡關系類型預測方法,其特征在于該方法具體是:
步驟(1).對網絡數據進行預處理,具體是:
(1-1).網絡數據結構化表示:網絡數據存在結構化網絡數據和半結構化網絡數據,將半結構化網絡數據轉換成結構化網絡數據{(vs1,ve1,flag1),(vs2,ve2,flag2),…,(vsi,vei,flagi),…,(vsn,ven,flagn)};其中,n表示網絡邊數量,vsi、vei分別表示始末節點,樣本標簽flagi等于1或-1,表示實際關系類型為友好或敵對,i=1,2,…,n;
(1-2).結構化網絡數據標準化表示:結構化網絡數據轉換成邊列表或鄰接列表;
邊列表:{(vs1,ve1),(vs2,ve2),…,(vsi,vei),…,(vsn,ven)},(vsi,vei)表示vsi、vei存在連邊;
鄰接列表:
{(vs1,vs1-e1,vs1-e2,…,vs1-ei,…,vs1-en),(vs2,vs2-e1,vs2-e2,…,vs2-ei,…,vs2-en),…,(vsk,vsk-e1,vsk-e2,…,vsk-ei,…,vsk-en)};k表示網絡中每個節點的維數;
步驟(2).邊列表或鄰接列表利用Node2Vec網絡嵌入方法進行節點表征,得到網絡中每個節點的k維特征向量表示,具體是:
采用有偏的隨機游走方法,通過參數p和q調控從一個節點向下一個節點的游走概率;給定節點v,隨機游走選擇下一個節點x的概率為:
其中,πvx為節點v和節點x之間的未歸一化轉移概率,Z是歸一化常數;假設當前隨機游走經過邊(t,v)到達節點v,πvx=αpq(t,x)·wvx;αpq(t,x)表示節點x偏離節點t的概率,wvx是節點v和節點x之間的權重,節點t是隨機游走序列中位于節點v的前一個節點;
dtx∈{0,1,2},表示節點t與節點x之間的最短距離;
用Node2Vec學習采樣的頂點序列,得到節點的網絡表征向量集:{(fv1-1,fv1-2,…,fv1-k),(fv2-1,fv2-2,…,fv2-k),…,(fvi-1,fvi-2,…,fvi-k),…,(fvn-1,vvn-2,…,fvn-k)};(fvi-1,fvi-2,…,fvi-k)表示網絡中節點i對應的k維特征向量的表示;
步驟(3).對網絡表征向量集進行網絡特征工程處理,并劃分訓練集和測試集,具體是:
(3-1).網絡特征工程:拼接相鄰兩個節點特征向量和兩個節點特征向量的差向量得到3×k維的樣本特征向量,即結構化網絡數據轉換GraphData={simple1,…,simplei,…simplen},其中樣本simplei=([fsi-1,fsi-2,…,fsi-k],[fei-1,fei-2,…,fei-k],[fsi-1-fei-1,fsi-2-fei-2,…,fsi-k-fei-k],flagi)映射步驟(1-1)中結構化網絡數據中的(vsi,vei,flagi);
(3-2).數據集劃分:對GraphData進行隨機抽取,70~80%數據作為訓練集,20~30%數據作為測試集;
步驟(4).用GridCV調參方法分別對ExtraTrees、GradienBoosting、LightGBM、XGBboost基學習器在訓練集上進行超參的調優:通過GridCV計算分別得到ExtraTrees、GradienBoosting、LightGBM和XGBboost的超參組合,用超參組合初始化各個基學習器,得到調優模型BaseModel1、BaseModel2、BaseModel3、BaseModel4;
步驟(5).用得到的調優模型作為基學習器,采用K折交叉驗證方法對訓練集預測,融合基學習器預測結果作為元學習器RandomForest的輸入數據,并輸出最終網絡關系類型預測的結果,具體是:
(5-1).K折交叉驗證基學習器:在訓練集上分別對BaseModel1、BaseModel2、BaseModel3、BaseModel4進行K折交叉驗證,即將訓練集分成K份,生成訓練子集,四個基學習器分別得到訓練子集的預測集R1、R2、R3、R4;
(5-2).元學習器訓練:將預測集R1、R2、R3、R4拼接得到新的訓練集,用RandomForest作為元學習器進行訓練,結合訓練好的基學習器和元學習器得到最終的融合模型StackingModel;
(5-3).預測結果并評估:通過StackingModel對測試集進行預測,采用入Roc_auc、Binary_F1、Macro_F1、Micro_F1作為模型性能評價指標,評估預測結果的效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州師范大學,未經杭州師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911414801.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:巖體結構探測及危石探測系統及方法
- 下一篇:一種基于深度信息的模具檢驗方法





