[發(fā)明專利]一種基于向量化特征的用戶網(wǎng)絡(luò)行為預測方法有效
| 申請?zhí)枺?/td> | 201910876860.4 | 申請日: | 2019-09-17 |
| 公開(公告)號: | CN110609901B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計)人: | 喬學明;鄒睿;喬琳霏;王貽亮;張祥坤;許明;劉霄慧;孔亮;鄭鵬飛;夏迎雪;王彬;王俊凱;李愛國;劉燕燕;宮寶凝;朱東杰 | 申請(專利權(quán))人: | 國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/953;G06K9/62 |
| 代理公司: | 哈爾濱市松花江專利商標事務(wù)所 23109 | 代理人: | 時起磊 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 量化 特征 用戶 網(wǎng)絡(luò) 行為 預測 方法 | ||
一種基于向量化特征的用戶網(wǎng)絡(luò)行為預測方法,它屬于數(shù)據(jù)挖掘和行為預測技術(shù)領(lǐng)域。本發(fā)明解決了現(xiàn)有方法對用戶網(wǎng)絡(luò)行為預測的準確率低的問題。本發(fā)明根據(jù)用戶網(wǎng)絡(luò)行為的關(guān)聯(lián)性特點,使用用戶相關(guān)的用戶訪問日志,對用戶的網(wǎng)絡(luò)行為進行行為事務(wù)劃分;再根據(jù)劃分好的網(wǎng)絡(luò)行為事務(wù),對用戶網(wǎng)絡(luò)行為進行特征提取;最后根據(jù)提取出的用戶網(wǎng)絡(luò)行為的特征向量,對用戶網(wǎng)絡(luò)行為進行關(guān)聯(lián)性分析,將關(guān)聯(lián)性強的用戶網(wǎng)絡(luò)行為合并為一類,并根據(jù)分類結(jié)果對用戶的網(wǎng)絡(luò)行為進行預測。本發(fā)明方法將關(guān)聯(lián)性強的用戶網(wǎng)絡(luò)行為進行了合并,提升了對用戶網(wǎng)絡(luò)行為預測的準確性。本發(fā)明可以應用于對用戶網(wǎng)絡(luò)行為的預測。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘和行為預測技術(shù)領(lǐng)域,具體涉及一種用戶網(wǎng)絡(luò)行為預測方法。
背景技術(shù)
傳統(tǒng)上,基于日志的安全審計的數(shù)據(jù)來源單一,且僅停留在安全審計數(shù)據(jù)的輸入、查詢、統(tǒng)計等功能上,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)聯(lián)、關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢,缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段,導致了“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。智能的安全審計就是要能夠?qū)θ罩炯皩徍藬?shù)據(jù)進行分析挖掘,運用機器學習的方法從包含大量冗余信息的數(shù)據(jù)中提取出盡可能多的隱藏的安全信息,將其中的規(guī)律轉(zhuǎn)化為系統(tǒng)或用戶行為的特征,通過對數(shù)據(jù)的統(tǒng)計、濃縮、總結(jié)、關(guān)聯(lián)、分類、聚類等技術(shù)手段,抽象出利于進行判斷和比較的特征模型,動態(tài)的評估系統(tǒng)安全狀況,并不定期產(chǎn)生相關(guān)的預警信息。
用戶網(wǎng)絡(luò)行為預測方法是智能安全審計的重要環(huán)節(jié)。用戶網(wǎng)絡(luò)行為預測挖掘用于發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。隨著大量數(shù)據(jù)不停地收集和存儲,許多業(yè)界人士對于從他們的數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則越來越感興趣。從大量商務(wù)事務(wù)記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助許多商務(wù)決策的制定。雖然現(xiàn)有方法在用戶網(wǎng)絡(luò)行為預測方面已經(jīng)取得了一定的成就,但是現(xiàn)有方法對用戶網(wǎng)絡(luò)行為預測的準確率仍然較低,預測準確率有待進一步提高。
發(fā)明內(nèi)容
本發(fā)明的目的是為解決現(xiàn)有方法對用戶網(wǎng)絡(luò)行為預測的準確率低的問題,而提出了一種基于向量化特征的用戶網(wǎng)絡(luò)行為預測方法。
本發(fā)明為解決上述技術(shù)問題采取的技術(shù)方案是:一種基于向量化特征的用戶網(wǎng)絡(luò)行為預測方法,該方法包括以下步驟:
步驟一、在T時刻,收集T-T0至T時段內(nèi)的用戶訪問日志,獲得用戶訪問日志序列;
步驟二、對步驟一的用戶訪問日志序列進行預處理,分別獲得用戶訪問日志序列中的各日志文件對應的用戶網(wǎng)絡(luò)行為,各用戶網(wǎng)絡(luò)行為組成用戶網(wǎng)絡(luò)行為序列;
步驟三、對步驟二的用戶網(wǎng)絡(luò)行為序列進行網(wǎng)絡(luò)行為事務(wù)劃分,獲得各個網(wǎng)絡(luò)行為事務(wù);并對各個網(wǎng)絡(luò)行為事務(wù)進行編號;
步驟四、根據(jù)各個網(wǎng)絡(luò)行為事務(wù)的內(nèi)容以及各個網(wǎng)絡(luò)行為事務(wù)的編號,計算步驟二中的各個用戶網(wǎng)絡(luò)行為的特征向量;
步驟五、將步驟四獲得的各個用戶網(wǎng)絡(luò)行為的特征向量進行層次聚類,獲得對各個用戶網(wǎng)絡(luò)行為的分類結(jié)果,即T-T0至T時段內(nèi)的用戶訪問日志對應的分類結(jié)果;
步驟六、在T至T+T0時段內(nèi),若分類結(jié)果中的任意一個用戶網(wǎng)絡(luò)行為tj被執(zhí)行時,與tj處于同一分類的其他用戶網(wǎng)絡(luò)行為將被作為用戶網(wǎng)絡(luò)行為預測結(jié)果;
步驟七、在T+T0時刻,收集T至T+T0時段內(nèi)的用戶訪問日志,獲得用戶訪問日志序列;再重復步驟二至步驟五的過程,獲得T至T+T0時段內(nèi)的用戶訪問日志對應的分類結(jié)果;
利用T至T+T0時段內(nèi)的用戶訪問日志對應的分類結(jié)果替換T-T0至T時段內(nèi)的用戶訪問日志對應的分類結(jié)果,將替換后的分類結(jié)果用于T+T0至T+2T0時段內(nèi)的用戶網(wǎng)絡(luò)行為預測;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司,未經(jīng)國家電網(wǎng)有限公司;國網(wǎng)山東省電力公司威海供電公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910876860.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





