[發明專利]基于語義化直觀/非直觀用戶性格表示的用戶關系畫像方法有效
| 申請號: | 201910980998.9 | 申請日: | 2019-10-16 |
| 公開(公告)號: | CN110825824B | 公開(公告)日: | 2023-06-13 |
| 發明(設計)人: | 車寧遠;王博 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F40/30;G06F40/284 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 曹玉平 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 直觀 用戶 性格 表示 關系 畫像 方法 | ||
本發明公開了基于語義化直觀?非直觀用戶性格表示的用戶關系畫像方法,首先,獲取語言數據庫;然后,分別通過直觀用戶性格表示方式和非直觀用戶性格表示方式得到關系畫像;綜合步驟二得到的用戶間關系的語義化畫像作為最終的用戶關系語義化畫像。其中,直觀方式是基于用戶的個人語言文本,計算用戶的大五人格五個維度分值并生成一組五維向量作為該用戶的語義化畫像;兩組五維向量做差值計算得到用戶間關系的語義化畫像。非直觀方式是將獲取的用戶的個人語言文本在word2vec工具訓練生成詞向量;根據用戶名稱提取用戶詞向量,將用戶詞向量作為該用戶的用戶語義畫像;計算兩用戶的用戶詞向量間的余弦相似度和均值向量即為用戶間關系的語義化畫像。
技術領域
本發明涉及了人物畫像和基于人物畫像的關系畫像構建方法,屬于社會計算領域的一個重點研究問題。該方法利用用戶在互聯網發表的個人語言文本對人物和人際關系進行直觀及非直觀自動化畫像。
背景技術
在社會語言學理論中,語言文字不僅僅具有語言學中的符號表示意義,還包含著社會中復雜的因素及文化的意義。語言的文字體系構建了社會關系結構,并控制著社會關系內容,因而社會語言學認為語言結構和社會結構之間存在相互影響的機制。薩丕爾-沃爾夫假設表明,語言結構決定了人們的思維,進而人們的思維決定了行為和社會關系。
識別和了解社會網絡中的人際關系是社會計算領域一個非常重要的課題,是社區發現、影響力分析、鏈接預測、個性化推薦等研究的基礎。在一個關系畫像的過程中,可以分為兩個角度,分別是關系特性和關系內涵。關系特性是關系量化和計算的基本屬性,關系內涵是關系參與者之間的關系內容。
在當前研究中,關系特性的研究多表現為利用一些網絡結構信息來研究社會關系,傳統社會關系分析研究多傾向于關系的方向、強度和類型。但社會網絡結構具有靜態、非主觀、的特點,傳統的社會關系分析缺乏語義性。關系內涵主要表現為關系類型識別,大部分是已知的比如師生、朋友、戀人之類。更一般的情況下,研究者將關系類型設置為簡單的正負二元性類別,因此對關系內涵的研究逐漸演變為關系類型的識別及分類。然而,這種基于關系類型識別和分類的研究方式已經無法滿足關系內涵的需要,關系類型十分有限,需要一系列詞匯來描述關系,并且同樣的關系類型往往存在不同的關系內涵。
因此,需要一種信息量更加豐富的方法,來刻畫具有豐富語義內涵的關系畫像,并使得該關系畫像具有內涵性。
發明內容
針對上述現有技術,本發明嘗試通過用戶的個人語言文本數據得到用戶畫像,并利用用戶畫像間的聯系,建立一種基于用戶語言文本的人際關系畫像自動化構建方法。
為了解決上述技術問題,本發明提出一種基于語義化直觀-非直觀用戶性格表示的用戶關系畫像方法,首先,獲取語言數據庫;然后,分別通過直觀用戶性格表示方式和非直觀用戶性格表示方式得到關系畫像;最后,綜合步驟二得到的用戶間關系的語義化畫像作為最終的用戶關系語義化畫像。
進一步講,本發明中,通過直觀用戶性格表示方式得到關系畫像的具體內容是:根據獲取的用戶的個人語言文本,計算用戶的大五人格五個維度分值,大五人格五個維度包括外傾性、穩定性、責任性、宜人性和開放性;將該用戶的五個維度分值結構生成一組五維向量作為該用戶的語義化畫像;將兩用戶的兩組五維向量做差值計算,得到的結果為用戶間關系的大五人格用戶關系向量,該關系向量即為用戶間關系的語義化畫像。
本發明中,通過非直觀用戶性格表示方式得到關系畫像的具體內容是:根據獲取的用戶的個人語言文本,在word2vec工具訓練生成詞向量;根據用戶名稱提取用戶詞向量,將用戶詞向量作為該用戶的用戶語義畫像;計算兩用戶的用戶詞向量間余弦相似度并求平均值,得到的余弦相似度和均值向量即為用戶間關系的語義化畫像。
與現有技術相比,本發明的有益效果是:
1、為了實現本發明的目的,本發明充分利用人們在互聯網中留下的個人語言信息這一非常優質的資源,由于用戶個人語言中包含豐富的語義信息,因此計算得到的關系畫像具備了豐富的語義內涵。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910980998.9/2.html,轉載請聲明來源鉆瓜專利網。





