[發(fā)明專利]一種基于行為的社交網(wǎng)絡(luò)用戶屬性值反演方法有效
| 申請?zhí)枺?/td> | 201710957182.5 | 申請日: | 2017-10-16 |
| 公開(公告)號: | CN107590742B | 公開(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計)人: | 趙志濱;姚蘭;于戈;鮑玉斌;陳郭成;劉佳良;張?zhí)斐?/a>;李芳芳;許存立;劉歡;王勛;儲佳紅;唐夢嬌;徐瑛蔚;李壯;王宗怡;石玉鑫;梁睿博;楊澤清;趙永恒;關(guān)亨;王思遠;吳永琪;華鈺;高若涵 | 申請(專利權(quán))人: | 東北大學(xué) |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00 |
| 代理公司: | 北京君泊知識產(chǎn)權(quán)代理有限公司 11496 | 代理人: | 王程遠 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 行為 社交 網(wǎng)絡(luò) 用戶 屬性 反演 方法 | ||
本發(fā)明公開了一種基于行為的社交網(wǎng)絡(luò)用戶屬性值反演方法,基于行為的用戶屬性值反演方法的思想是針對反演對象在社交網(wǎng)絡(luò)多話題下的評論行為,發(fā)現(xiàn)與反演對象具有相似網(wǎng)絡(luò)行為的人群,再利用群體屬性值與個體屬性值之間的映射策略以及帶權(quán)重的投票機制,對網(wǎng)絡(luò)用戶的屬性值進行推測并將結(jié)果賦給反演對象。這種方法一方面可以動態(tài)填補和修正用戶屬性信息中所存在的缺失值、錯誤值;更進一步可以為社交網(wǎng)絡(luò)中的個性化推薦提供更為可靠的原始數(shù)據(jù)。提高網(wǎng)絡(luò)用戶信息的準(zhǔn)確性,最終達到動態(tài)填補和修正網(wǎng)絡(luò)用戶屬性缺失值和錯誤值的目的。
技術(shù)領(lǐng)域
本發(fā)明涉及社交網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種基于行為的社交網(wǎng)絡(luò)用戶屬性值反演方法。
背景技術(shù)
近幾年,互聯(lián)網(wǎng)的高速發(fā)展大大提升了社交網(wǎng)絡(luò)的關(guān)注度,許多社交平臺不僅為用戶展示快速、全面的社會輿情信息,還為科學(xué)研究提供了大量的實時參考數(shù)據(jù)。
社交網(wǎng)絡(luò)為人們快速了解熱點話題、社會新聞帶來便捷,用戶關(guān)注消息的方式也從平面媒體轉(zhuǎn)變?yōu)榫W(wǎng)絡(luò)媒體。用戶在注冊社交網(wǎng)絡(luò)平臺賬號時需要填寫本人屬性信息,這些數(shù)據(jù)將會作為簡介展示在個人主頁中。但是不同社交網(wǎng)站注冊的基本屬性信息類別不盡相同,如Facebook要求用戶填寫興趣、學(xué)校等信息,而Linkin則更加注重與用戶教育背景、工作背景相關(guān)的內(nèi)容。絕大多數(shù)社交網(wǎng)站的注冊信息中都包括年齡、性別、所在地等基本屬性數(shù)據(jù)。然而,隨著社交網(wǎng)絡(luò)平臺注冊用戶數(shù)量的急劇增加,用戶屬性信息中存在大量缺失值和錯誤值的問題逐漸突顯出來。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明的目的在于提供一種基于行為的社交網(wǎng)絡(luò)用戶屬性值反演方法。
為了解決背景技術(shù)中所存在的問題,本發(fā)明的技術(shù)方案為:
一種基于行為的社交網(wǎng)絡(luò)用戶屬性值反演方法,包括:
1)、獲取目標(biāo)反演用戶的屬性信息和參與話題的評論信息;
2)、根據(jù)目標(biāo)反演用戶的參與話題的評論信息,獲取目標(biāo)反演用戶的行為信息;
3)、在目標(biāo)反演用戶參與的話題下,根據(jù)用戶的行為信息,獲取網(wǎng)絡(luò)行為相似度,將用戶劃分成若干細分群體;
4)、獲取各個細分群體用戶的顯著性屬性數(shù)值,并根據(jù)帶權(quán)重的投票機制對反演目標(biāo)用戶屬性值進行反演。
所述步驟2具體包括:
2.1、獲取同一話題評論中用戶人群的行為信息,行為信息包括評論情感和評論角度;
2.2、根據(jù)用戶人群的評論情感和評論角度,獲取用戶之間的行為相似度,所述行為相似度包括情感相似度和角度相似度;
2.3、根據(jù)用戶之間的行為相似度,將用戶人群劃分成若干細分群體,所述細分群體內(nèi)用戶的行為相似度大于細分群體間用戶的行為相似度。
所述評論情感sentiment分為正向Positive、中立Neutral和負向Negative,并且分別表示為+1、0、-1。
所述評論情感sentiment基于情感詞典的情感值計算方法計算用戶評論文本的情感,所述情感詞典包括:知網(wǎng)(HowNet)情感詞典、臺灣大學(xué)簡體中文情感極性詞典(NTSUSD)、哈工大整體同義詞詞林拓展版。
所述評論角度insight為用戶對話題t評論詞語的集合:
其中,wj(1≤j≤m)為一個特征項;
用戶u針對一個具體話題t的評論角度向量可以表示為
每個特征項wj的對應(yīng)取值vu(wj)為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710957182.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q50-00 專門適用于特定經(jīng)營部門的系統(tǒng)或方法,例如公用事業(yè)或旅游
G06Q50-02 .農(nóng)業(yè);漁業(yè);礦業(yè)
G06Q50-04 .制造業(yè)
G06Q50-06 .電力、天然氣或水供應(yīng)
G06Q50-08 .建筑
G06Q50-10 .服務(wù)
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應(yīng)用上下文中的搜索的查詢意圖表達
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲介質(zhì)
- 動態(tài)社交圈確定方法、裝置、設(shè)備及存儲介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計算機設(shè)備及存儲介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





