[發明專利]一種基于行為的社交網絡用戶屬性值反演方法有效
| 申請號: | 201710957182.5 | 申請日: | 2017-10-16 |
| 公開(公告)號: | CN107590742B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 趙志濱;姚蘭;于戈;鮑玉斌;陳郭成;劉佳良;張天成;李芳芳;許存立;劉歡;王勛;儲佳紅;唐夢嬌;徐瑛蔚;李壯;王宗怡;石玉鑫;梁睿博;楊澤清;趙永恒;關亨;王思遠;吳永琪;華鈺;高若涵 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00 |
| 代理公司: | 北京君泊知識產權代理有限公司 11496 | 代理人: | 王程遠 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 行為 社交 網絡 用戶 屬性 反演 方法 | ||
1.一種基于行為的社交網絡用戶屬性值反演方法,其特征在于,包括:
1)、獲取目標反演用戶的屬性信息和參與話題的評論信息;
2)、根據目標反演用戶的參與話題的評論信息,獲取目標反演用戶的行為信息;
3)、在目標反演用戶參與的話題下,根據用戶的行為信息,獲取網絡行為相似度,將用戶劃分成若干細分群體;
4)、獲取各個細分群體用戶的顯著性屬性數值,并根據帶權重的投票機制對目標反演用戶屬性值進行反演;
所述步驟2具體包括:
2.1、獲取同一話題評論中用戶人群的行為信息,行為信息包括評論情感和評論角度;
2.2、根據用戶人群的評論情感和評論角度,獲取用戶之間的行為相似度,所述行為相似度包括情感相似度和角度相似度;
2.3、根據用戶之間的行為相似度,將用戶人群劃分成若干細分群體,所述細分群體內用戶的行為相似度大于細分群體間用戶的行為相似度;
所述步驟4)獲取各個細分群體用戶的顯著性屬性數值具體為:
采用變異系數作為衡量用戶屬性值統計量間差距的標準,得到具有共同行為特征的人群的最大公共屬性;
所述變異系數是對屬性值最大類間方差的計算,通過滑動分割的方法將屬性值區間分為兩個區間,將每個區間看作一個類,分別計算并比較每次分割結果的類間方差,從而得到最大類間方差以及對應的分割方式;
所述評論角度insightu(t)為用戶u對話題t評論詞語的集合:
insightu(t)={wj|wj∈insight(t)},
其中,wj為一個特征項,1≤j≤m;
用戶u針對一個具體話題t的評論角度向量可以表示為
每個特征項wj的對應取值vu(wj)為:
2.根據權利要求1所述的基于行為的社交網絡用戶屬性值反演方法,其特征在于,所述評論情感sentiment分為正向Positive、中立Neutral和負向Negative,并且分別表示為+1、0、-1。
3.根據權利要求1或2所述的基于行為的社交網絡用戶屬性值反演方法,其特征在于,所述評論情感sentiment為基于情感詞典的情感值計算方法計算用戶評論文本的情感,所述情感詞典包括:知網情感詞典、臺灣大學簡體中文情感極性詞典、哈工大整體同義詞詞林拓展版。
4.根據權利要求1所述的基于行為的社交網絡用戶屬性值反演方法,其特征在于,所述情感相似度:
其中,假設相同話題t,用戶ui發表的評論為ci',用戶uj發表的評論為cj',那么對于用戶ui和uj,如果情感sentiment相同,則情感相似度為1;反之則為0;
所述角度相似度:
其中,Q為用戶角度矩陣,用戶ui和uj,共同參與話題t的討論,角度向量分別為向量間夾角越小,用戶評價的角度就越相似;對于話題t,用戶ui的評論集合中特征項wj對應的權重為qij,用戶的評論角度如公式所示:
所述行為相似度:
behaviorSim(ui,uj)=sentimentSim(ui,uj)+insightSim(ui,uj)。
5.根據權利要求1所述的基于行為的社交網絡用戶屬性值反演方法,其特征在于,所述將用戶人群劃分成若干細分群體為通過用戶人群AP聚類算法完成人群細分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710957182.5/1.html,轉載請聲明來源鉆瓜專利網。





