[發(fā)明專利]基于網(wǎng)絡日志的用戶行為刻畫與預測方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910089017.1 | 申請日: | 2019-01-30 |
| 公開(公告)號: | CN109783460A | 公開(公告)日: | 2019-05-21 |
| 發(fā)明(設計)人: | 康海燕;王紫豪 | 申請(專利權(quán))人: | 北京信息科技大學 |
| 主分類號: | G06F16/18 | 分類號: | G06F16/18;G06K9/62 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 杜陽陽 |
| 地址: | 100000 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)絡日志 性格特征 行為特征向量 用戶行為 預測 向量 相似度 刻畫 數(shù)據(jù)支持 防范 | ||
本發(fā)明公開了一種基于網(wǎng)絡日志的用戶行為刻畫與預測方法及系統(tǒng)。該方法包括:獲取用戶的網(wǎng)絡日志;根據(jù)網(wǎng)絡日志提取用戶的行為特征向量;獲取標準性格特征向量;計算用戶的行為特征向量與各標準性格特征向量的相似度;將相似度最高的標準性格特征向量所代表的性格特征確定為用戶的性格特征;確定用戶的行為特征向量中理科類關(guān)鍵詞數(shù)量和文科類關(guān)鍵詞數(shù)量;根據(jù)用戶的行為特征向量中理科類關(guān)鍵詞數(shù)量和文科類關(guān)鍵詞數(shù)量的比值,預測用戶的行為。本發(fā)明提供的基于網(wǎng)絡日志的用戶行為刻畫與預測方法及系統(tǒng)能夠?qū)τ脩舻男愿瘛⑿袨檫M行預測,進而,為防范危害的發(fā)生提供數(shù)據(jù)支持。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于網(wǎng)絡日志的用戶行為刻畫與預測方法及系統(tǒng)。
背景技術(shù)
隨著網(wǎng)絡與信息資源的飛速發(fā)展,網(wǎng)絡搜索引擎已成為人們獲取信息的主要途徑,網(wǎng)絡搜索日志包含了用戶的行為和需求,從網(wǎng)絡日志可以判斷出一個人的性格,甚至可以預測用戶接下來要做的事情。這在安全領(lǐng)域尤其重要,可以根據(jù)用戶接下來的行為來判斷哪些用戶可歸為危險人群,如黑客經(jīng)常使用社會工程學的方法利用人的弱點進行攻擊。如用戶信息泄露,犯罪分子在網(wǎng)絡上搜索用戶的身份信息、手機號碼等實施盜取賬號資金的目的。黑客首先進行信息偵探,收集名字、電話號碼、身份證號等信息,從而偽裝用戶以實現(xiàn)對服務器端的欺騙,盜取用戶賬戶。因此,如果安全部門通過分析網(wǎng)絡日志,便可判斷出危險的人群,甚至可以知道這類人群甚至特定的人接下來要做的事,就可以提前預警,防范危害的發(fā)生。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于網(wǎng)絡日志的用戶行為刻畫與預測方法及系統(tǒng),能夠?qū)τ脩舻男愿襁M行刻畫預測,進而,根據(jù)用戶性格預測用戶的危險性,為防范危害的發(fā)生提供數(shù)據(jù)支持。
為實現(xiàn)上述目的,本發(fā)明提供了如下方案:
一種基于網(wǎng)絡日志的用戶行為刻畫與預測方法,包括:
獲取用戶的網(wǎng)絡日志;
根據(jù)所述網(wǎng)絡日志提取所述用戶的行為特征向量,所述行為特征向量為用戶網(wǎng)絡日志中各領(lǐng)域關(guān)鍵詞占關(guān)鍵詞總數(shù)的比例所構(gòu)成的向量,所述領(lǐng)域分為自然科學領(lǐng)域和社會科學領(lǐng)域,所述自然科學領(lǐng)域包括軍事、科技、體育、旅游和食物,所述社會科學領(lǐng)域包括史政、文藝、社會、娛樂和美容;
獲取標準性格特征向量,所述標準性格特征向量為標準性格中各領(lǐng)域關(guān)鍵詞占關(guān)鍵詞總數(shù)的比例所構(gòu)成的向量,所述領(lǐng)域分為自然科學領(lǐng)域和社會科學領(lǐng)域,所述自然科學領(lǐng)域包括軍事、科技、體育、旅游和食物,所述社會科學領(lǐng)域包括史政、文藝、社會、娛樂和美容;
計算所述用戶的行為特征向量與各所述標準性格特征向量的相似度;
將相似度最高的標準性格特征向量所代表的性格特征確定為所述用戶的性格特征。
可選的,確定所述用戶的行為特征向量中理科類關(guān)鍵詞數(shù)量和文科類關(guān)鍵詞數(shù)量;
根據(jù)用戶的行為特征向量中理科類關(guān)鍵詞數(shù)量和文科類關(guān)鍵詞數(shù)量的比值,預測所述用戶的行為。
可選的,所述計算所述用戶的行為特征向量與各所述標準性格特征向量的相似度,具體包括:
計算所述用戶的行為特征向量與各所述標準性格特征向量的余弦相似度;
將余弦相似度最小的標準性格特征向量確定為與所述用戶行為特征向量相似度最大的標準性格特征向量。
可選的,所述將相似度最高的標準性格特征向量所代表的性格特征確定為所述用戶的性格特征,具體包括:
將所述標準性格特征向量劃分為積極性格、中級性格和消極性格三種類型;
將與用戶行為特征向量相似度最大的標準性格特征向量所屬類型確定為所述用戶的性格類型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京信息科技大學,未經(jīng)北京信息科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910089017.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種確定用戶的偏好模式的方法及裝置
- 應用程序動態(tài)行為的特征向量的生成方法及裝置
- 一種病毒程序檢測方法、裝置及檢測服務器
- 基于多源數(shù)據(jù)融合的用戶行為檢測方法及裝置
- 行為識別方法、裝置及計算機存儲介質(zhì)
- 網(wǎng)絡行為的檢測方法、裝置、計算機設備和存儲介質(zhì)
- 一種基于圖神經(jīng)網(wǎng)絡的新聞推薦方法及其系統(tǒng)
- 推薦方法、裝置、服務器及存儲介質(zhì)
- 一種基于文本語義監(jiān)督的視覺行為識別方法、系統(tǒng)及計算機可讀介質(zhì)
- 用戶行為數(shù)據(jù)的處理方法和多行為序列轉(zhuǎn)化模型訓練方法





