[發(fā)明專利]一種基于向量化特征的用戶網(wǎng)絡行為預測方法有效
| 申請?zhí)枺?/td> | 201910876860.4 | 申請日: | 2019-09-17 |
| 公開(公告)號: | CN110609901B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設計)人: | 喬學明;鄒睿;喬琳霏;王貽亮;張祥坤;許明;劉霄慧;孔亮;鄭鵬飛;夏迎雪;王彬;王俊凱;李愛國;劉燕燕;宮寶凝;朱東杰 | 申請(專利權)人: | 國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/953;G06K9/62 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 時起磊 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 量化 特征 用戶 網(wǎng)絡 行為 預測 方法 | ||
1.一種基于向量化特征的用戶網(wǎng)絡行為預測方法,其特征在于,該方法包括以下步驟:
步驟一、在T時刻,收集T-T0至T時段內的用戶訪問日志,獲得用戶訪問日志序列;
所述步驟一的具體過程為:
在T時刻,讀取路由節(jié)點產生的T-T0至T時段內的用戶訪問日志,將用戶訪問日志按照請求時間升序排序,得到用戶訪問日志序列;
且在讀取后,將T-T0至T時段內的用戶訪問日志清空;
步驟二、對步驟一的用戶訪問日志序列進行預處理,分別獲得用戶訪問日志序列中的各日志文件對應的用戶網(wǎng)絡行為,各用戶網(wǎng)絡行為組成用戶網(wǎng)絡行為序列;
所述步驟二的具體過程為:
按照各用戶訪問日志文件在用戶訪問日志序列中的前后順序,將第一個日志文件的時間列、用戶請求來源列以及請求行為列保存至數(shù)組a0,以此類推,將第二個日志文件的時間列、用戶請求來源列以及請求行為列保存至數(shù)組a1,直至全部日志文件的時間列、用戶請求來源列以及請求行為列均保存至對應的數(shù)組;
從數(shù)組a0開始,依次讀取各個數(shù)組,讀取的同時依次輸出各個數(shù)組對應的用戶網(wǎng)絡行為,即輸出各日志文件對應的用戶網(wǎng)絡行為,各用戶網(wǎng)絡行為組成用戶網(wǎng)絡行為序列;
步驟三、對步驟二的用戶網(wǎng)絡行為序列進行網(wǎng)絡行為事務劃分,獲得各個網(wǎng)絡行為事務;并對各個網(wǎng)絡行為事務進行編號;
所述步驟三的具體過程為:
在用戶網(wǎng)絡行為序列中,若相鄰的兩個用戶網(wǎng)絡行為的請求時間間隔超過10秒,則在該兩個用戶網(wǎng)絡行為之間設置間斷點,相反,若相鄰的兩個用戶網(wǎng)絡行為的請求時間間隔不超過10秒,則不在該兩個用戶網(wǎng)絡行為之間設置間斷點,遍歷整個用戶網(wǎng)絡行為序列后,將整個用戶網(wǎng)絡行為序列分割為若干個子序列,將每個子序列作為一個網(wǎng)絡行為事務;
按照每個子序列在用戶網(wǎng)絡行為序列中的先后順序,對網(wǎng)絡行為事務進行從0開始的不間斷遞增編號;
步驟四、根據(jù)各個網(wǎng)絡行為事務的內容以及各個網(wǎng)絡行為事務的編號,計算步驟二中的各個用戶網(wǎng)絡行為的特征向量;
步驟五、將步驟四獲得的各個用戶網(wǎng)絡行為的特征向量進行層次聚類,獲得對各個用戶網(wǎng)絡行為的分類結果,即T-T0至T時段內的用戶訪問日志對應的分類結果;
步驟六、在T至T+T0時段內,若分類結果中的任意一個用戶網(wǎng)絡行為tj被執(zhí)行時,與tj處于同一分類的其他用戶網(wǎng)絡行為將被作為用戶網(wǎng)絡行為預測結果;
步驟七、在T+T0時刻,收集T至T+T0時段內的用戶訪問日志,獲得用戶訪問日志序列;再重復步驟二至步驟五的過程,獲得T至T+T0時段內的用戶訪問日志對應的分類結果;
利用T至T+T0時段內的用戶訪問日志對應的分類結果替換T-T0至T時段內的用戶訪問日志對應的分類結果,將替換后的分類結果用于T+T0至T+2T0時段內的用戶網(wǎng)絡行為預測;
以此類推,實現(xiàn)任意時刻的用戶網(wǎng)絡行為的預測。
2.根據(jù)權利要求1所述的一種基于向量化特征的用戶網(wǎng)絡行為預測方法,其特征在于,所述步驟四的具體過程為:
分別為每個用戶網(wǎng)絡行為創(chuàng)建一個列向量F,每個用戶網(wǎng)絡行為對應的列向量F的維度均為網(wǎng)絡行為事務總個數(shù),并將列向量F的所有維度初始化為0;
對于一個用戶網(wǎng)絡行為ti,將包含ti的網(wǎng)絡行為事務進行統(tǒng)計,得到包含ti的網(wǎng)絡行為事務的編號組;在ti對應的列向量F中,將行數(shù)出現(xiàn)在網(wǎng)絡行為事務編號組的位置標記為1,其他位置仍然標記為0,獲得用戶網(wǎng)絡行為ti對應的特征向量;
同理,獲得其他各用戶網(wǎng)絡行為對應的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司,未經(jīng)國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910876860.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





