[發(fā)明專利]一種基于量化社會影響力的社交網(wǎng)絡(luò)用戶行為預(yù)測方法有效
| 申請?zhí)枺?/td> | 201710497921.7 | 申請日: | 2017-06-27 |
| 公開(公告)號: | CN107341571B | 公開(公告)日: | 2020-05-19 |
| 發(fā)明(設(shè)計)人: | 李瑞軒;熊小慶;李玉華;辜希武;楊琪;王號召;張鎮(zhèn);占旭寬 | 申請(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/00;G06F16/901;G06F16/35 |
| 代理公司: | 華中科技大學(xué)專利中心 42201 | 代理人: | 廖盈春;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 量化 社會 影響力 社交 網(wǎng)絡(luò) 用戶 行為 預(yù)測 方法 | ||
本發(fā)明公開了一種基于量化社會影響力的社交網(wǎng)絡(luò)用戶行為預(yù)測方法,該方法包括數(shù)據(jù)爬取、數(shù)據(jù)預(yù)處理、構(gòu)建網(wǎng)絡(luò)圖、用戶興趣提取、用戶間影響力量化、預(yù)測建模、模型訓(xùn)練評估。主要用于在大規(guī)模社交網(wǎng)絡(luò)中實現(xiàn)對用戶行為,例如社交網(wǎng)絡(luò)如Twitter上的轉(zhuǎn)推行為進行預(yù)測。同現(xiàn)有技術(shù)相比,本發(fā)明首先考慮量化社交網(wǎng)絡(luò)中用戶間的社會影響力,并將該量化的影響力引入到預(yù)測模型中來,使得預(yù)測模型能夠充分考量一個給定用戶周圍的其他用戶對該用戶行為的影響,并且本發(fā)明從用戶興趣這一角度出發(fā)來進行用戶行為的預(yù)測,通過量化的社會影響力來計算用戶的興趣,并最終由用戶興趣來推測用戶的行為,具有更高的準確度。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘和行為預(yù)測技術(shù)領(lǐng)域,更具體地,涉及一種基于量化社會影響力的社交網(wǎng)絡(luò)用戶行為預(yù)測方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)以及移動技術(shù)的發(fā)展,社交網(wǎng)絡(luò)迅速興起,而目前社交網(wǎng)絡(luò)的研究主要集中在用戶行為分析預(yù)測、用戶關(guān)系發(fā)現(xiàn)、個性化內(nèi)容推薦、社群挖掘、話題檢測和跟蹤等方面。Twitter等社交網(wǎng)絡(luò)的出現(xiàn)大大加快了信息在網(wǎng)絡(luò)中的傳播速度,用戶可以通過轉(zhuǎn)發(fā)別人的博文以及@別的用戶來把一條博文迅速的傳達給更多人,使一條博文的受眾面以幾何級別遞增,從而導(dǎo)致信息的病毒式傳播和擴散。由于預(yù)測用戶轉(zhuǎn)發(fā)與@行為有助于研究信息的擴散與傳播,因此社交網(wǎng)絡(luò)用戶行為預(yù)測的研究基本集中于預(yù)測用戶的轉(zhuǎn)發(fā)行為與@行為。
解決行為預(yù)測這個問題的好處在于,首先,被用戶轉(zhuǎn)發(fā)的話題往往反映了用戶所感興趣的話題,因此行為預(yù)測的研究也可用于對用戶進行推文或話題推薦;其次,通過對轉(zhuǎn)推行為進行預(yù)測研究,能夠幫助我們理解社交網(wǎng)絡(luò)中信息的傳播方式,并將之應(yīng)用于市場營銷或是熱點事件提取等。
早期的許多研究都集中在挖掘?qū)τ脩粜袨闀a(chǎn)生影響的一些重要因素,如推文本身的內(nèi)容、推文作者的粉絲數(shù)、關(guān)注數(shù)、注冊時長、用戶的個人興趣等因素都會對用戶的轉(zhuǎn)推行為造成影響,這些前期的探測為后期的深入研究奠定了一定的基礎(chǔ)。對于給定用戶的行為預(yù)測這個研究問題,現(xiàn)有的解決方案大多都集中在將對于行為預(yù)測有重要作用的一些特征因素加入到預(yù)測模型中,在這里,對于預(yù)測模型而言,許多研究都將用戶行為預(yù)測問題視為二類分類問題,因為行為預(yù)測的結(jié)果只有兩種,所以將其視為一個二分類問題,可以有效地幫助我們進行預(yù)測建模。而特征因素的表現(xiàn)形式多種多樣,如用戶特征、社交特征和微博特征,對于給定用戶轉(zhuǎn)推預(yù)測而言,大多數(shù)現(xiàn)有的研究都將關(guān)注點放在用戶特征(用戶個人興趣)及社交特征(用戶間的影響力)的選擇上,主要會考量用戶興趣對于用戶轉(zhuǎn)推行為的影響,即直接通過對用戶興趣建模來進行行為預(yù)測,或者通過研究用戶間影響力來預(yù)測其他用戶是否會轉(zhuǎn)發(fā)特定用戶的推文的,但是在使用中發(fā)現(xiàn),僅根據(jù)用戶興趣或者用戶間影響力來對用戶的轉(zhuǎn)推行為進行預(yù)測,預(yù)測的準確率較低。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的以上缺陷或改進需求,本發(fā)明的目的在于提供了一種基于量化社會影響力的社交網(wǎng)絡(luò)用戶行為預(yù)測方法,由此解決在現(xiàn)有的用戶行為預(yù)測方法中,僅根據(jù)用戶興趣或者用戶間影響力來對用戶的轉(zhuǎn)推行為進行預(yù)測而導(dǎo)致的預(yù)測準確率較低的技術(shù)問題。
為實現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種基于量化社會影響力的社交網(wǎng)絡(luò)用戶行為預(yù)測方法,包括以下步驟:
(1)爬取種子用戶所關(guān)注的用戶信息以及種子用戶所關(guān)注的用戶所關(guān)注的用戶信息,得到n個用戶的用戶信息,并爬取n個用戶中的每個用戶在時刻t之前發(fā)布的N條文本,對爬取的所有文本進行預(yù)處理;
(2)根據(jù)用戶之間的關(guān)注關(guān)系以目標用戶vi為核心構(gòu)建網(wǎng)絡(luò)圖,其中,網(wǎng)絡(luò)圖中的節(jié)點表示用戶,網(wǎng)絡(luò)圖中的有向邊表示該有向邊對應(yīng)的兩用戶之間存在關(guān)注關(guān)系,有向邊的指向由關(guān)注用戶指向被關(guān)注用戶,網(wǎng)絡(luò)圖中的有向邊對應(yīng)的權(quán)重表示該有向邊對應(yīng)的關(guān)注用戶對被關(guān)注用戶發(fā)表文本的轉(zhuǎn)發(fā)概率;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710497921.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





