[發明專利]基于網絡日志的用戶行為刻畫與預測方法及系統在審
| 申請號: | 201910089017.1 | 申請日: | 2019-01-30 |
| 公開(公告)號: | CN109783460A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 康海燕;王紫豪 | 申請(專利權)人: | 北京信息科技大學 |
| 主分類號: | G06F16/18 | 分類號: | G06F16/18;G06K9/62 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 杜陽陽 |
| 地址: | 100000 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡日志 性格特征 行為特征向量 用戶行為 預測 向量 相似度 刻畫 數據支持 防范 | ||
1.一種基于網絡日志的用戶行為刻畫與預測方法,其特征在于,包括:
獲取用戶的網絡日志;
根據所述網絡日志提取所述用戶的行為特征向量,所述行為特征向量為用戶網絡日志中各領域關鍵詞占關鍵詞總數的比例所構成的向量,所述領域分為自然科學領域和社會科學領域,所述自然科學領域包括軍事、科技、體育、旅游和食物,所述社會科學領域包括史政、文藝、社會、娛樂和美容;
獲取標準性格特征向量,所述標準性格特征向量為標準性格中各領域關鍵詞占關鍵詞總數的比例所構成的向量,所述領域分為自然科學領域和社會科學領域,所述自然科學領域包括軍事、科技、體育、旅游和食物,所述社會科學領域包括史政、文藝、社會、娛樂和美容;
計算所述用戶的行為特征向量與各所述標準性格特征向量的相似度;
將相似度最高的標準性格特征向量所代表的性格特征確定為所述用戶的性格特征。
2.根據權利要求1所述的基于網絡日志的用戶行為刻畫與預測方法,其特征在于,所述方法還包括:
確定所述用戶的行為特征向量中理科類關鍵詞數量和文科類關鍵詞數量;
根據用戶的行為特征向量中理科類關鍵詞數量和文科類關鍵詞數量的比值,預測所述用戶的行為。
3.根據權利要求1所述的基于網絡日志的用戶行為刻畫與預測方法,其特征在于,所述計算所述用戶的行為特征向量與各所述標準性格特征向量的相似度,具體包括:
計算所述用戶的行為特征向量與各所述標準性格特征向量的余弦相似度;
將余弦相似度最小的標準性格特征向量確定為與所述用戶行為特征向量相似度最大的標準性格特征向量。
4.根據權利要求1所述的基于網絡日志的用戶行為刻畫與預測方法,其特征在于,所述將相似度最高的標準性格特征向量所代表的性格特征確定為所述用戶的性格特征,具體包括:
將所述標準性格特征向量劃分為積極性格、中級性格和消極性格三種類型;
將與用戶行為特征向量相似度最大的標準性格特征向量所屬類型確定為所述用戶的性格類型。
5.根據權利要求2所述的基于網絡日志的用戶行為刻畫與預測方法,其特征在于,所述根據用戶的行為特征向量中理科類關鍵詞數量和文科類關鍵詞數量的比值,預測所述用戶的行為,具體包括:
當所述用戶的行為特征向量中理科類關鍵詞數量與文科類關鍵詞數量的比值為3:1時,預測所述用戶有對他人造成傷害的可能性。
6.一種基于網絡日志的用戶行為刻畫與預測系統,其特征在于,包括:
網絡日志獲取模塊,用于獲取用戶的網絡日志;
用戶行為特征向量提取模塊,用于根據所述網絡日志提取所述用戶的行為特征向量,所述行為特征向量為用戶網絡日志中各領域關鍵詞占關鍵詞總數的比例所構成的向量,所述領域分為自然科學領域和社會科學領域,所述自然科學領域包括軍事、科技、體育、旅游和食物,所述社會科學領域包括史政、文藝、社會、娛樂和美容;
標準性格特征向量獲取模塊,用于獲取標準性格特征向量,所述標準性格特征向量為標準性格中各領域關鍵詞占關鍵詞總數的比例所構成的向量,所述領域分為自然科學領域和社會科學領域,所述自然科學領域包括軍事、科技、體育、旅游和食物,所述社會科學領域包括史政、文藝、社會、娛樂和美容;
相似度計算模塊,用于計算所述用戶的行為特征向量與各所述標準性格特征向量的相似度;
用戶性格刻畫模塊,用于將相似度最高的標準性格特征向量所代表的性格特征確定為所述用戶的性格特征。
7.根據權利要求6所述的基于網絡日志的用戶行為刻畫與預測系統,其特征在于,所述系統還包括:
關鍵詞數量確定模塊,用于確定所述用戶的行為特征向量中理科類關鍵詞數量和文科類關鍵詞數量;
用戶行為預測模塊,用于根據用戶的行為特征向量中理科類關鍵詞數量和文科類關鍵詞數量的比值,預測所述用戶的行為。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信息科技大學,未經北京信息科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910089017.1/1.html,轉載請聲明來源鉆瓜專利網。





