[發明專利]一種基于多維度的網絡空間人物畫像方法在審
| 申請號: | 202110286268.6 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN115114498A | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 彭媛媛;張海霞;連一峰;黃克振;劉倩 | 申請(專利權)人: | 中國科學院軟件研究所 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9535 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多維 網絡 空間 人物 畫像 方法 | ||
1.一種基于多維度的網絡空間人物畫像方法,其步驟包括:
1)構建網絡空間的人物畫像體系,所述人物畫像體系包括人物的基本信息、個人經歷、社交信息、用戶標簽和社會關系;
2)對于一目標人物,從百度百科、維基百科爬取該目標人物的基本信息和社交信息;然后從社交信息中獲取該目標人物的社交賬號和關聯人物,并根據社交賬號從社交媒體采集該目標人物的用戶注冊信息、關注與被關注信息、用戶發布信息和關注粉絲信息,用于補充該目標人物的社交信息;然后根據該目標人物在社交賬號中的相關信息計算該目標人物的社交影響指數;
3)依據該目標人物的姓名、所在單位搜集人物簡歷,獲取該目標人物的個人經歷;
4)利用該目標人物的年齡階段、職業所涉及行業作為目標人物標記身份標簽;
5)根據該目標人物在社交媒體Twitter中發布的消息數量,計算社交媒體Twitter相對于該目標人物的權重γTwitter,并計算該目標人物在社交媒體Twitter中發布的消息中詞語的TF-IDF值,選取TF-IDF值靠前的N個詞語Twitter_Words(w1,w2,…,wN),然后將所選N個詞語的TF-IDF值與權重γTwitter相乘,得到更新后的詞語TF-IDF值;
6)根據該目標人物在微博中發布的消息數量,計算微博相對于該目標人物的權重γWeibo,并計算該目標人物在微博中發布的消息中詞語的TF-IDF值,選取TF-IDF值靠前的N個詞語Weibo_Words(w1,w2,…,wN);然后將所選N個詞語的TF-IDF值與權重γWeibo相乘,得到更新后的詞語TF-IDF值;
7)根據步驟5)、6)所得更新后的詞語TF-IDF值對詞語進行排序,選取TF-IDF值靠前若干詞語作為該目標人物的興趣標簽。
2.如權利要求1所述的方法,其特征在于,計算該目標人物的用戶社交影響力的方法為:
2-1)根據該目標人物的社交信息計算用戶消息參與度其中n代表該目標人物最近一段時間T內發布的消息數量,SpreDegreei代表第i條消息的傳播度,CoNumi代表第i條消息的評論數量,SuNumi代表第i條消息的點贊數量;
2-2)計算該目標人物的粉絲的認證情況和最新動態評估得出該目標人物的活躍粉絲數ActiveFan′;
2-3)根據該目標人物在Twitter和微博中的屬性信息計算得出該目標人物的用戶可信度Reliability;
2-4)利用層次分析法計算該目標人物的用戶消息參與度Participation、活躍粉絲數ActiveFan′、可信度Reliability相對用戶影響的權重,分別為wpar,wfan,wrel;
2-5)計算該目標人物的在Twitter、微博的影響力Influencet∈{Twitter,Weibo}=wpar×Participation+wfan×ActiveFan′+wrel×Reliability;
2-6)基于D-S理論構建用戶社交影響指數評估框架,將該目標人物在Twitter和微博中的影響力分別做歸一化處理后作為用戶社交影響指數評估框架的基本信任分配;
2-7)利用D-S理論中的合成法則分別對該目標人物在社交媒體Twitter下的基本信任與該目標人物在微博下的基本信任進行合成,將合成后的結果作為該目標人物的用戶社交影響指數Influence。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110286268.6/1.html,轉載請聲明來源鉆瓜專利網。





