[發明專利]一種基于多維度的網絡空間人物畫像方法在審
| 申請號: | 202110286268.6 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN115114498A | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 彭媛媛;張海霞;連一峰;黃克振;劉倩 | 申請(專利權)人: | 中國科學院軟件研究所 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9535 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多維 網絡 空間 人物 畫像 方法 | ||
本發明公開了一種基于多維度的網絡空間人物畫像方法,其步驟包括:1)構建網絡空間的人物畫像體系,所述人物畫像體系包括人物的基本信息、個人經歷、社交信息、用戶標簽和社會關系;2)對于一目標人物,爬取該目標人物的基本信息和社交信息計算該目標人物的社交影響指數;3)獲取該目標人物的個人經歷;4)利用該目標人物的年齡階段、職業所涉及行業作為目標人物標記身份標簽人物標記身份標簽;5)根據該目標人物在社交媒體Twitter和微博中發布的消息數量,計算權重γTwitter、γWeibo,并計算消息中詞語的TF?IDF值與對應權重相乘,選取TF?IDF值靠前若干詞語作為該目標人物的興趣標簽。
技術領域
本發明屬于計算機領域,尤其涉及一種基于多維度的網絡空間人物畫像評估方法。
背景技術
隨著計算機技術快速發展,互聯網服務廣泛普及,使人類社會逐步進入到網絡化時代。2020年9月,我國互聯網信息中心發布了第46次《中國互聯網絡發展狀況統計報告》,其內容顯示我國的網民規模達到9.4億,普及率達67.0%。隨著網民數量的不斷增長,各類網絡論壇、微博平臺等社交媒體日益發展成熟,成為繼報紙、電視等傳統媒體之后傳遞各類信息的主要載體。開展對互聯網中重點關注人物的全方位畫像分析,對維護社會的穩定具有重要的應用價值。
按照人物畫像過程中人物數據和應用方向的不同,現有技術的人物畫像可以劃分為基于行為數據的畫像、基于社交媒體的畫像。
基于行為數據的畫像,是將人物的行為作為描繪人物畫像模型構建的依據。人物行為是指人物為滿足特定的信息需求在信息行為中采取的各種動作和表現,研究主要包括人物的信息檢索行為、信息瀏覽行為等,來源多為訪問日志。研究學者們主要從人物的訪問信息中挖掘出其行為的規律與特征,構建畫像模型。根據畫像模型,信息服務提供者可以預測人物的行動,實現精準信息服務的目的。但該類人物畫像領域性較強,且數據較難獲取。
基于社交媒體數據的畫像,是將人物在社交網絡中的言論和交互行為作為描繪畫像模型構建的依據。社交網絡中的人物由于評論、轉發、點贊等行為在網絡世界構建了各種各樣的社會化聯系,這種聯系具有紐帶的作用,增強了人與人之間的聯系,且人物之間的聯系具有實時性與動態性特征。目前,基于社交媒體數據的畫像有兩點:一是注重對人物社交媒體社會關系的描繪;二是注重人物數據的群體性特征,根據相似性等指標將人物劃分為具有某一共同標簽的群體。
人物畫像是一個新興的研究領域,國內外的學者們從模型構建、技術、應用領域等多個角度進行了研究和探討,這些研究成果可以為后續人物畫像及其應用的相關研究提供基礎。但是,目前研究也有一定的局限性,人物畫像構建的維度較為單一,目前關于人物畫像的構建分別以人物的基本數據、興趣數據、行為數據等為基礎,人物畫像過程中所獲取的人物數據也多數為顯性,針對內容、社會關系網絡等存在大量隱性信息為依據的人物畫像模型的研究還不夠深入;針對同一人物在不同平臺的信息行為、表現缺乏比較性的研究;針對同一人物在不同時間段信息行為的研究較為匱乏。
針對這一類問題,本發明將利用多源數據從人物的基本信息、社交信息、用戶標簽等多個方面進行全方位的網絡空間畫像。
在社交信息畫像中,用戶的影響力評估是描述人物的重要指標之一。傳統研究方法中多考慮了用戶關注關系和粉絲數量等,通常認為粉絲量大的用戶影響力相對較大。但有研究學者在研究微博用戶影響力時,把微博用戶粉絲數量和微博轉發數量進行對比,發現粉絲數多的微博用戶所發微博并不一定被其他用戶轉發,從而說明粉絲數量多的用戶的影響力不一定會很大,這類方法沒有綜合考慮到用戶與粉絲的互動行為。由此,一些研究方法引入了用戶社交行為、言論傳播情況能解決社交網絡用戶影響力問題,即通過分析用戶發表言論以及粉絲互動、傳播的情況進行影響力評估。基于以上調研,本發明將從人物自身屬性和互動行為中綜合分析人物影響力,以提升人物影響力計算的準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110286268.6/2.html,轉載請聲明來源鉆瓜專利網。





