[發明專利]在社交網絡中基于泊松過程模型的事件流行度預測方法有效
| 申請號: | 201410334425.6 | 申請日: | 2014-07-14 |
| 公開(公告)號: | CN104182457B | 公開(公告)日: | 2017-08-01 |
| 發明(設計)人: | 陳凱;周異;何建華;周曲;楊蒙蒙 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/04;G06Q50/00 |
| 代理公司: | 上海漢聲知識產權代理有限公司31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社交 網絡 基于 過程 模型 事件 流行 預測 方法 | ||
1.一種在社交網絡中基于泊松過程模型的事件流行度預測方法,其特征在于包括如下步驟:
第一步,選取樣本事件,并獲取樣本事件的傳播鏈;
第二步,用戶影響力計算,并篩選影響力大的用戶作為關鍵用戶,并將剩下的用戶標記為非關鍵用戶;
第三步,將關鍵用戶帶來的轉發傳播過程建模為泊松過程模型,而對非關鍵用戶帶來的轉發傳播過程,僅僅使用樣本數據獲得一個經驗比例值;
第四步,使用樣本事件的信息來學習和估計關鍵用戶的泊松過程模型的參數以及非關鍵用戶的參數,以確定第三步中的模型;
第五步,給定一個已知時間長度的演化信息的新的事件,根據第三步中的模型來預測它在未來某時刻的流行度。
2.根據權利要求1所述的在社交網絡中基于泊松過程模型的事件流行度預測方法,其特征在于:上述第一步中,選取樣本事件是指:對發生在某一個社交網絡平臺中的熱點事件進行選擇,這里的熱點事件是指被該社交網絡平臺或其他熱門排行榜列為熱點話題;這里的事件通過事件內容的一組關鍵詞來描述,本身是一組內容相近的用戶產生內容(UGC)的集合;選取的事件需要反映這個社交網絡平臺在一定時間段內的所有熱點事件信息。
3.根據權利要求2所述的在社交網絡中基于泊松過程模型的事件流行度預測方法,其特征在于:所述選取樣本事件是按照下面的步驟選取的:
(1)周期性的分別從各大熱門話題榜各獲取前10個熱門事件的標題;
(2)用新聞搜索引擎搜索熱門事件的標題,獲取有關事件更多的文本信息和關鍵詞;
(3)在社交網絡的搜索頁面中搜索每個事件的關鍵詞,解析出和該事件有關的原創熱門UGC;
(4)使用社交網絡開放平臺提供的API來獲取每個事件中的原創UGC的轉發鏈,包括每條UGC的創建時間、文本、作者信息;
(5)檢測有規律的發布UGC,發布UGC時間間隔短,重復多次轉發同一個社交網絡用戶的水軍賬戶,刪除它們發出的所有UGC。
4.根據權利要求1-3任一項所述的在社交網絡中基于泊松過程模型的事件流行度預測方法,其特征在于:所述第一步中,獲取樣本事件的傳播鏈中的傳播鏈是指參與事件傳播的社交網絡用戶的用戶產生內容(UGC)之間具有轉發關系,這些UGC轉發關系構成有向的具有時間性的傳播關系鏈叫UGC傳播鏈;獲取傳播鏈是指通過社交網絡平臺提供的API獲取參與事件傳播的用戶人數大于閾值T2的UGC傳播鏈,T2是任意正整數,T2為0表示獲取事件相關的所有傳播鏈,參與人數少的UGC傳播鏈將被舍去。
5.根據權利要求1所述的在社交網絡中基于泊松過程模型的事件流行度預測方法,其特征在于:所述第二步中,用戶的影響力是指該用戶在事件傳播過程中吸引其他用戶參與事件傳播的能力,用戶影響力跟他的粉絲數、粉絲質量、用戶之間的交互、發布用戶產生內容(UGC)的轉發數,甚至和參與事件的主題有關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410334425.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:云平臺數據訪問安全隔離方法
- 下一篇:一種文件自動清理的方法及裝置





