[發(fā)明專利]在社交網(wǎng)絡(luò)中基于泊松過程模型的事件流行度預(yù)測方法有效
| 申請?zhí)枺?/td> | 201410334425.6 | 申請日: | 2014-07-14 |
| 公開(公告)號: | CN104182457B | 公開(公告)日: | 2017-08-01 |
| 發(fā)明(設(shè)計(jì))人: | 陳凱;周異;何建華;周曲;楊蒙蒙 | 申請(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/04;G06Q50/00 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 社交 網(wǎng)絡(luò) 基于 過程 模型 事件 流行 預(yù)測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域內(nèi)社交網(wǎng)絡(luò)中的事件流行度預(yù)測方法,具體地說,涉及的是一種在社交網(wǎng)絡(luò)中基于泊松過程模型的事件流行度預(yù)測方法。
背景技術(shù)
在Web2.0時(shí)代,社交網(wǎng)絡(luò)發(fā)展如火如荼,逐漸成為網(wǎng)民日常生活中的重要部分。微博作為一種通過關(guān)注機(jī)制分享簡短信息的廣播式的新型社交網(wǎng)絡(luò)平臺(tái),它具有操作簡單、互動(dòng)性強(qiáng)等特點(diǎn)。到2012年年底,新浪微博注冊用戶數(shù)已經(jīng)超過了4億,微博作為一種新興媒體,它在傳播信息、形成熱點(diǎn)話題和熱點(diǎn)事件中起到了越來越重要的作用。微博正成為社會(huì)輿論熱點(diǎn)的主要策源地,全面參與并影響著現(xiàn)實(shí)世界。
微博在熱點(diǎn)事件的發(fā)生到推重整個(gè)過程中起到非常關(guān)鍵的作用,如果能在事件發(fā)生的初期就對其未來的流行度有較準(zhǔn)確的預(yù)測,將能夠給相關(guān)部門或企業(yè)爭取時(shí)間,對事件發(fā)展進(jìn)行合理引導(dǎo)和及時(shí)采取相應(yīng)的對策。因此為了避免熱點(diǎn)事件由于處理不當(dāng)或者處理不及時(shí)可能帶來的經(jīng)濟(jì)損失和不良社會(huì)后果,對事件的流行度進(jìn)行預(yù)測非常必要,具有重大社會(huì)意義。
經(jīng)檢索,目前沒有與事件流行度的預(yù)測相關(guān)的公開專利。
發(fā)明內(nèi)容
本發(fā)明要解決的問題是提供一種在社交網(wǎng)絡(luò)中對事件的流行度進(jìn)行預(yù)測的方法,并基于此,對事件的流行度進(jìn)行預(yù)測,從而可以早的對事件的發(fā)展態(tài)勢了解,給相關(guān)部門或企業(yè)爭取盡可能多的時(shí)間制定對策。
本發(fā)明一個(gè)目的是提供一種社交網(wǎng)絡(luò)中事件流行度的預(yù)測方法,具體包括:
第一步,選取樣本事件,并獲取樣本事件的微博傳播鏈;
第二步,用戶影響力計(jì)算,并篩選影響力大的作為關(guān)鍵用戶,并將剩下的用戶標(biāo)記為非關(guān)鍵用戶;
第三步,將關(guān)鍵用戶帶來的轉(zhuǎn)發(fā)微博過程建模為泊松過程模型,而對非關(guān)鍵用戶帶來的轉(zhuǎn)發(fā)微博過程簡單處理;
第四步,使用樣本事件的信息來學(xué)習(xí)和估計(jì)關(guān)鍵用戶的泊松過程模型的參數(shù)以及非關(guān)鍵用戶的參數(shù);
第五步,給定一個(gè)已知一定時(shí)間長度的演化信息的新的事件,根據(jù)第三步中的模型來預(yù)測它在未來某時(shí)刻的流行度。
所述第一步中,選取樣本事件是指:對發(fā)生在某一個(gè)社交網(wǎng)絡(luò)平臺(tái)中的熱點(diǎn)事件進(jìn)行選擇,這里的熱點(diǎn)事件是指被該社交網(wǎng)絡(luò)平臺(tái)或其他熱門排行榜列為熱點(diǎn)話題;這里的事件通過事件內(nèi)容的一組關(guān)鍵詞來描述,本身是一組內(nèi)容相近的用戶產(chǎn)生內(nèi)容(UGC)的集合;選取的事件需要反映這個(gè)社交網(wǎng)絡(luò)平臺(tái)在一定時(shí)間段內(nèi)的所有熱點(diǎn)事件信息。
優(yōu)選地,所述選取樣本事件是按照下面的步驟選取的:
(1)周期性的分別從各大熱門話題榜各獲取前10個(gè)熱門事件的標(biāo)題;
(2)用新聞搜索引擎搜索熱門事件的標(biāo)題,獲取有關(guān)事件更多的文本信息和關(guān)鍵詞;
(3)在社交網(wǎng)絡(luò)的搜索頁面中搜索每個(gè)事件的關(guān)鍵詞,解析出和該事件有關(guān)的原創(chuàng)熱門UGC;
(4)使用社交網(wǎng)絡(luò)開放平臺(tái)提供的API來獲取每個(gè)事件中的原創(chuàng)UGC的轉(zhuǎn)發(fā)鏈,包括每條UGC的創(chuàng)建時(shí)間、文本、作者信息;
(5)檢測有規(guī)律的發(fā)布UGC,發(fā)布UGC時(shí)間間隔短,重復(fù)多次轉(zhuǎn)發(fā)同一個(gè)社交網(wǎng)絡(luò)用戶的水軍賬戶,刪除它們發(fā)出的所有UGC。
優(yōu)選地,所述第一步中,獲取樣本事件的傳播鏈中的傳播鏈?zhǔn)侵竻⑴c事件傳播的社交網(wǎng)絡(luò)用戶的用戶產(chǎn)生內(nèi)容(UGC)之間具有轉(zhuǎn)發(fā)關(guān)系,這些UGC轉(zhuǎn)發(fā)關(guān)系構(gòu)成有向的具有時(shí)間性的傳播關(guān)系鏈叫UGC傳播鏈;獲取傳播鏈?zhǔn)侵竿ㄟ^社交網(wǎng)絡(luò)平臺(tái)提供的API獲取參與事件傳播的用戶人數(shù)大于閾值T2的UGC傳播鏈,T2是任意正整數(shù),T2為0表示獲取事件相關(guān)的所有傳播鏈,參與人數(shù)少的UGC傳播鏈將被舍去。
優(yōu)選地,所述第二步中,用戶的影響力是指該用戶在事件傳播過程中吸引其他用戶參與事件傳播的能力,用戶影響力跟他的粉絲數(shù)、粉絲質(zhì)量、用戶之間的交互、發(fā)布用戶產(chǎn)生內(nèi)容(UGC)的轉(zhuǎn)發(fā)數(shù),甚至和參與事件的主題有關(guān)。所述用戶的影響力采用基于PageRank的方法計(jì)算;或者用戶ui的影響力si采用以下方法獲得:
(1)計(jì)算每個(gè)用戶在樣本事件數(shù)據(jù)中的發(fā)出的UGC數(shù)
(2)計(jì)算每個(gè)用戶在樣本事件數(shù)據(jù)中由其一級轉(zhuǎn)發(fā)用戶產(chǎn)生的UGC轉(zhuǎn)發(fā)數(shù)
(3)用來代表這樣一個(gè)用戶集合,在這個(gè)集合中的每個(gè)用戶uj發(fā)出的UGC的轉(zhuǎn)發(fā)數(shù)之和都為并且uj至少轉(zhuǎn)發(fā)了ui一次,那么用戶ui的影響力用下面的式子計(jì)算:
其中|U|代表用戶集合U中的用戶數(shù)。
更好地,所述關(guān)鍵用戶的篩選過程如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410334425.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 一種社交對象搜索方法及裝置
- 針對嵌入式應(yīng)用上下文中的搜索的查詢意圖表達(dá)
- 一種關(guān)鍵社交信息的確定方法及裝置
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 控制社交分享信息在社交空間的呈現(xiàn)狀態(tài)的方法與設(shè)備
- 社交角色管理方法、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于社交關(guān)系的社交屬性數(shù)據(jù)確定方法、裝置及設(shè)備
- 一種社交賬戶推薦方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





