[發明專利]一種基于多元化關系畫像技術的在線社會關系搜索方法有效
| 申請號: | 202010153660.9 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111488401B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 王博;楊毅 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/26;G06F16/245 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李麗萍 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多元化 關系 畫像 技術 在線 社會關系 搜索 方法 | ||
本發明公開了一種基于多元化關系畫像技術的在線社會關系搜索方法,首先,針對指定的語料數據基于非直觀和直觀畫像方法進行人際關系畫像;然后,通過人際關系在線畫像系統將人際關系畫像進行可視化,即得到與該人際關系畫像結果對應的社會關系網絡拓撲圖,并通過網絡拓撲圖中邊的顏色和粗細反映關系的類型和強度。然后可在該網絡拓撲圖中根據設定的好友關系數量和好友關系類型進行人物搜索,根據與設定的關系個例最相似的關系進行人物關系搜索,并實時顯示搜索結果。本發明以統一的方式表示直觀畫像和非直觀畫像結果,并提供了搜索方法,為研究兩種畫像方式之間的內在聯系提供了一個重要的可視化工具以及理論基礎。
技術領域
本發明涉及數據挖掘,用戶畫像,社會關系網絡拓撲結構分析方法。
背景技術
社會關系畫像是社會計算領域中一個重要也是熱門的研究話題。當前,社會關系畫像有兩種主要形式:非直觀畫像和直觀畫像。非直觀畫像即用網絡拓撲結構來對社會關系進行描述,而非直觀畫像網絡拓撲結構的生成又有很多不同的方法。其中,三元閉包理論和平衡論以及其擴展理論是較早的社會關系畫像理論,其可以直接用在社會關系網絡拓撲圖中對社會關系進行建模。此外,利用關系嵌入方法將關系字符等距離嵌入到提及關系雙方的上下文語料中然后利用word2vec方法來獲得關系字符向量,用關系字符向量來描述非直觀畫像網絡拓撲結構圖中的邊是另外一種常用的方法。利用wrod2vec方法進行用戶畫像獲得用戶向量,通過用戶向量差來表示用戶之間的關系也是一種非直觀畫像的方法。對于直觀畫像而言,使用幾個詞語或者句子來直觀地反映關系是最常用的方法,比如,針對小說《三國演義》,用“父子”來描述關系“劉備-阿斗”,用“兄弟”來描述關系“劉備-關羽”。
然而,非直觀畫像與直觀畫像結果是否一致,兩者之間是否有一定的聯系目前尚未形成定論。同時也沒有非直觀畫像和直觀畫像自動生成工具,因此導致探索這兩種畫像方式的內在聯系有極大不便。此外,社會關系的兩大屬性關系強度和關系類型的研究也往往各執一派,尚沒有研究去探索不同畫像方式關系強度和關系類型之間蘊含的一些聯系。
發明內容
針對上述現有技術,本發明旨在設計并開發一個基于多元化關系畫像的社會關系搜索方法。允許用戶上傳兩種不同類型的語料數據,分別是第三方描述數據(新聞,電影劇本等)和人物語言數據(微博等社會媒體言論)。本發明中根據數據文件,自動生成其對應的非直觀畫像或者直觀畫像,并通過設計和改進算法,利用統一的網絡拓撲結構圖來直觀反映不同畫像方法的畫像結果。同時,通過為網絡拓撲結構圖中的邊設置不同的顏色,粗細來反映社會關系的類型和強度屬性。可以直觀地看到不同畫像方法生成的社會關系網絡拓撲結構圖,來進行對比和研究。生成網絡拓撲結構圖后,本發明提供了基于好友關系數量和好友關系類型的人物搜索方法以及基于關系相似度的關系搜索方法。此外,作為本發明的延伸,還設計有結點關系分類,結點合并,核心人物定位等功能來方便在生成網絡拓撲結構圖后做進一步研究分析。
為了解決上述技術問題,本發明提出了一種基于多元化關系畫像技術的在線社會關系搜索方法,首先,針對指定的語料數據基于非直觀畫像方法和直觀畫像方法得到人際關系畫像;然后,通過人際關系在線畫像系統將人際關系畫像進行可視化,即得到與該人際關系畫像結果對應的社會關系網絡拓撲圖,根據設定的好友關系數量和好友關系類型在該社會關系網絡拓撲圖中進行人物搜索,根據與設定的關系個例最相似的關系在該社會關系網絡拓撲圖中進行人物關系搜索,并實時顯示人物和人物關系的搜索結果。
進一步講,本發明所述的基于多元化關系畫像技術的在線社會關系搜索方法,其中,所述語料數據包括第三方描述數據和人物語言數據,第三方描述數據是指以第三人稱的方式對人物進行描述的語料數據,人物語言數據是指人物在社交媒體上以第一人稱的方式發表的一些互動語言或者觀點看法。
所述非直觀畫像包括基于關系嵌入方法的非直觀畫像或是基于向量差方法的非直觀畫像;所述直觀畫像是基于主題詞方法的直觀畫像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010153660.9/2.html,轉載請聲明來源鉆瓜專利網。





