[發(fā)明專利]一種融合話題因子的信息傳播預(yù)測模型及方法在審
| 申請?zhí)枺?/td> | 201711328590.0 | 申請日: | 2017-12-13 |
| 公開(公告)號: | CN107944635A | 公開(公告)日: | 2018-04-20 |
| 發(fā)明(設(shè)計)人: | 廖祥文;陳國龍;鄭候東;楊定達(dá) | 申請(專利權(quán))人: | 福州大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/00 |
| 代理公司: | 福州元創(chuàng)專利商標(biāo)代理有限公司35100 | 代理人: | 蔡學(xué)俊,薛金才 |
| 地址: | 350116 福建省福州市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 話題 因子 信息 傳播 預(yù)測 模型 方法 | ||
1.一種融合話題因子的信息傳播預(yù)測模型,其特征在于:包括:
一借助于LDA主題模型學(xué)習(xí)帖子的話題向量;
一生存分析模型,其用于刻畫用戶行為,通過所述話題向量調(diào)整用戶間的傳播速率,并采用融合時間衰減因素的傳播概率模型Power-Law來學(xué)習(xí)一組可觀測的級聯(lián)集合最小化的負(fù)對數(shù)似然函數(shù);
一負(fù)采樣算法組成模塊,用于克服所有的負(fù)例限制了模型適用于大規(guī)模的數(shù)據(jù)和優(yōu)化目標(biāo)函數(shù)的平衡性;
一融合話題因子的情感信息傳播模型,其學(xué)習(xí)用戶的分布式表達(dá)算法;
以及實驗任務(wù)和對應(yīng)的評價指標(biāo),該指標(biāo)用于預(yù)測用戶在潛在網(wǎng)絡(luò)下對不同話題信息的傳播行為。
2.根據(jù)權(quán)利要求1所述的融合話題因子的信息傳播預(yù)測模型,其特征在于:還包括數(shù)據(jù)預(yù)處理模塊;所述數(shù)據(jù)預(yù)處理模塊在用戶間轉(zhuǎn)發(fā)關(guān)系和被轉(zhuǎn)發(fā)關(guān)系未知的情況下,僅保留了用戶被感染的時間序列作為初始級聯(lián)數(shù)據(jù)集。
3.根據(jù)權(quán)利要求1所述的融合話題因子的信息傳播預(yù)測模型,其特征在于:還包括數(shù)據(jù)基本假設(shè)模塊,所述數(shù)據(jù)基本假設(shè)模塊中設(shè)定:信息傳播過程發(fā)生在靜態(tài)網(wǎng)絡(luò)上,該網(wǎng)絡(luò)不會隨著時間的變化而變化;如果某個未被感染的節(jié)點被它的第一個父節(jié)點所感染后,它將不會再次受到其他父節(jié)點的感染,并且被感染的節(jié)點只能感染未被感染的節(jié)點;用戶間觀點的傳播由傳播者的影響力和接受者的易感性共同決定。
4.根據(jù)權(quán)利要求1所述的融合話題因子的信息傳播預(yù)測模型,其特征在于:所述生存分析模型中通過函數(shù)進行采樣,從而初始化級聯(lián)數(shù)據(jù)集中每個用戶的影響力矩陣和易感性矩陣,具體包括以下步驟:用戶間的傳播速率函數(shù)由傳播者的影響力矩陣、接受者的易感性矩陣、微博帖子的話題向量和情感極性共同組成的;利用傳播速率計算用戶間的概率密度函數(shù),之后的得到累積概率密度函數(shù);然后引入生存分析模型,計算用戶未受到其他已被感染的用戶影響的生存函數(shù)和受到其他已被感染的用戶影響的風(fēng)險函數(shù)。
5.根據(jù)權(quán)利要求4所述的融合話題因子的信息傳播預(yù)測模型,其特征在于:給定的時間窗口內(nèi),對于一條級聯(lián),計算非源節(jié)點用戶在某個時刻被感染的似然和一條可觀測的傳播級聯(lián)的聯(lián)合似然,并在加入生存概率獲得一條可觀測到的級聯(lián)的似然式子;假設(shè)級聯(lián)之間互相獨立,則一組可觀測的級聯(lián)集合最小化的負(fù)對數(shù)似然函數(shù)即為目標(biāo)函數(shù);對于目標(biāo)函數(shù)中負(fù)例似然,以一組級聯(lián)中負(fù)例用戶在真實信息傳播中被感染的頻率進行概率抽樣替換原有方法考慮了所有負(fù)例的情況。
6.根據(jù)權(quán)利要求4所述的融合話題因子的信息傳播預(yù)測模型,其特征在于:將影響力矩陣和易感性矩陣進行分塊,分別得到正面影響力向量、負(fù)面影響力向量、正面易感性向量和負(fù)面易感性向量,然后采用帶有投影的隨機梯度下降法進行求解;在給定的網(wǎng)絡(luò),信息內(nèi)容和初始傳播狀態(tài)后,將其應(yīng)用于任務(wù)評估所提出的方法在預(yù)測信息傳播過程的效果。
7.一種融合話題因子的信息傳播預(yù)測方法,其特征在于:包括以下步驟:
步驟S1:對數(shù)據(jù)進行過濾,僅保留每條級聯(lián)用戶被感染的時間戳;
步驟S2:首先定義用戶間的傳播速率函數(shù)由傳播者的影響力矩陣和接受者的易感性矩陣組成,并加入了話題向量進行調(diào)整;在融合時間衰減因素的概率傳播模型Power-Law中,計算概率密度函數(shù)和累積概率密度函數(shù),最后利用生存分析模型構(gòu)建生存函數(shù),風(fēng)險函數(shù),并獲得一組可觀測的級聯(lián)集合最小化的負(fù)對數(shù)似然函數(shù);
步驟S3:根據(jù)負(fù)例在一組級聯(lián)中出現(xiàn)的頻率分布對其進行采樣;
步驟S4:在給定的網(wǎng)絡(luò),信息內(nèi)容和初始傳播狀態(tài)后,將其應(yīng)用于任務(wù)評估所提出的方法在預(yù)測信息傳播過程的效果。
8.根據(jù)權(quán)利要求7所述的融合話題因子的信息傳播預(yù)測方法,其特征在于:步驟S1中
過濾規(guī)則包括:
1).根據(jù)帖子的時效性,將前后轉(zhuǎn)發(fā)超過一周時間后面的用戶轉(zhuǎn)發(fā)序列去掉;
2).定義用戶的活躍度為數(shù)據(jù)集中該用戶轉(zhuǎn)發(fā)他人的次數(shù)和該用戶被他人轉(zhuǎn)發(fā)的次數(shù)之和;
3). 選取數(shù)據(jù)集中用戶活躍度超過某個閾值的用戶作為種子用戶,對于每條帖子轉(zhuǎn)發(fā)關(guān)系鏈,按照活躍用戶所占的比例從大到小排序后刪除比例小的級聯(lián)。
9.根據(jù)權(quán)利要求6所述的融合話題因子的信息傳播預(yù)測方法,其特征在于:步驟S3包括以下步驟:
步驟S31:計算每個負(fù)例未歸一化前的分布值,即在級聯(lián)集合中出現(xiàn)的次數(shù);
步驟S32:統(tǒng)計所有負(fù)例的頻率之和,并利用該值進行概率歸一化;
步驟S33:根據(jù)負(fù)例用戶的id進行排序,并計算出相應(yīng)的概率,以累積分布函數(shù)的形式排列在一條線段上;
步驟S34:將線段均勻劃分為m段,左端點0對應(yīng)概率值為0,右端點m對應(yīng)的概率值為1;將該線段與步驟S33中得到的線段進行映射后,得出每段區(qū)間所對應(yīng)的負(fù)例用戶編號;
步驟S35:對0-m中的值進行隨機抽樣,獲取該值相應(yīng)的用戶編號即為采樣的負(fù)例,概率大小與負(fù)例頻率的3/4次方成正比;
步驟S36:按照預(yù)定的負(fù)例采樣次數(shù) ,不斷執(zhí)行步驟S35。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711328590.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- Ⅶ因子多肽和Ⅷ因子多肽的聯(lián)合應(yīng)用
- VII因子多肽和IX因子多肽的聯(lián)合應(yīng)用
- 一種城鄉(xiāng)生態(tài)規(guī)劃的生態(tài)等級空間分區(qū)規(guī)劃控制方法
- 一種基于阿爾法散度的動態(tài)PET圖像因子處理方法
- 一種設(shè)備綜合風(fēng)險評估方法、裝置和電力系統(tǒng)
- 一種集群資源容量預(yù)測方法和裝置
- 一種計算因子植入方法、介質(zhì)及設(shè)備
- 一種規(guī)模組網(wǎng)環(huán)境TI-LFA可靠性評估測試方法
- 近地表品質(zhì)因子確定方法及系統(tǒng)
- 一種模擬凝血過程的教學(xué)模型
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





