[發(fā)明專利]一種熱點(diǎn)話題下多消息互影響的用戶行為預(yù)測系統(tǒng)及方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711380240.9 | 申請(qǐng)日: | 2017-12-20 |
| 公開(公告)號(hào): | CN108229731B | 公開(公告)日: | 2021-03-23 |
| 發(fā)明(設(shè)計(jì))人: | 肖云鵬;李凈樺;劉紅;李暾;李茜;劉宴兵 | 申請(qǐng)(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號(hào): | G06F30/27 | 分類號(hào): | G06F30/27 |
| 代理公司: | 重慶市恒信知識(shí)產(chǎn)權(quán)代理有限公司 50102 | 代理人: | 李金蓉 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 熱點(diǎn)話題 消息 影響 用戶 行為 預(yù)測 系統(tǒng) 方法 | ||
1.一種熱點(diǎn)話題下多消息互影響的用戶行為預(yù)測系統(tǒng),其特征在于,包括:獲取數(shù)據(jù)模塊、解析屬性模塊、構(gòu)建模型模塊及預(yù)測分析模塊,其中
獲取數(shù)據(jù)模塊,用于通過社交網(wǎng)絡(luò)獲取并統(tǒng)計(jì)數(shù)據(jù),包括某話題下的多條消息、參與了這些消息的用戶和用戶的相關(guān)屬性;
解析屬性模塊,用于將獲取到的社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析,分別從內(nèi)部影響因素和外部影響因素來提取相關(guān)屬性,內(nèi)部影響因素即用戶個(gè)人特征屬性,外部影響因素即多消息之間相互影響屬性;
構(gòu)建模型模塊,用于將用戶自身的若干屬性和多消息之間的相互影響屬性作為輸入,輸入層節(jié)點(diǎn)數(shù)為7,輸出用戶是否參與話題,故輸出層節(jié)點(diǎn)數(shù)為,按照專家經(jīng)驗(yàn),取輸入層節(jié)點(diǎn)數(shù)與輸出層節(jié)點(diǎn)數(shù)之積開平方作為隱含層節(jié)點(diǎn)個(gè)數(shù),將BP神經(jīng)網(wǎng)絡(luò)中隱含層的節(jié)點(diǎn)個(gè)數(shù)設(shè)為3,然后不斷調(diào)整輸入層與隱含層之間的連接權(quán)重,確定好權(quán)重之后即對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到用戶是否會(huì)參與話題下多消息的參與預(yù)測模型;
預(yù)測分析模塊,將輸入數(shù)據(jù)輸入到參與預(yù)測模型進(jìn)行用戶是否會(huì)參與該話題下其他消息的預(yù)測,通過分析得到的預(yù)測結(jié)果量化熱點(diǎn)話題下消息間的相關(guān)性;
所述構(gòu)建模型模塊主要包括以下處理步驟:S31:對(duì)抓取到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),按照用戶自身特征屬性和多消息之間相互影響屬性進(jìn)行量化;
S32:根據(jù)抓取到的數(shù)據(jù)對(duì)應(yīng)輸入層各個(gè)屬性的函數(shù)值,以及組成是否會(huì)參與該話題下其他消息的結(jié)果集,在結(jié)果集中選取部分已得到的結(jié)果用來訓(xùn)練數(shù)據(jù),同時(shí)剩下的未知的結(jié)果用來測試數(shù)據(jù);
S33:根據(jù)專家經(jīng)驗(yàn),將學(xué)習(xí)率η設(shè)定為0.1,同時(shí)在(0,1)的范圍內(nèi)隨機(jī)初始化網(wǎng)絡(luò)中所有連接權(quán)和閾值;利用輸入的屬性,訓(xùn)練數(shù)據(jù)和BP算法進(jìn)行模型擬合;
S34:根據(jù)當(dāng)前參數(shù)以及公式其中f表示激活函數(shù),計(jì)算當(dāng)前樣本的輸出其中表示第k個(gè)訓(xùn)練例實(shí)際輸出的第j維;βj表示輸出層第j個(gè)神經(jīng)元接收到的輸入值;θj表示輸出層第j個(gè)神經(jīng)元的閾值;
S35:然后利用訓(xùn)練例的實(shí)際輸出值和期望輸出值計(jì)算輸出層神經(jīng)元的梯度項(xiàng)gj,其計(jì)算公式如下:
在式1中,表示訓(xùn)練例的實(shí)際輸出值;表示訓(xùn)練例的期望輸出值;
S36:利用隱含層和輸出層的數(shù)據(jù)計(jì)算隱含層神經(jīng)元的梯度項(xiàng)eh,其計(jì)算公式如下:
在式2中,bh表示隱含層第h個(gè)神經(jīng)元的輸出;l表示輸出神經(jīng)元的個(gè)數(shù);ωhj表示隱含層第h個(gè)神經(jīng)元與輸出層第j個(gè)神經(jīng)元之間的連接權(quán);
S37:然后根據(jù)求得的梯度項(xiàng)和訓(xùn)練集的輸入進(jìn)行更新連接權(quán)ωhj,vih與閾值θj,γh;其中vih表示輸入層第i個(gè)神經(jīng)元與隱含層第h個(gè)神經(jīng)元之間的連接權(quán)重;γh表示隱含層第h個(gè)神經(jīng)元的閾值;
S38:更新迭代過程循環(huán)進(jìn)行,直到訓(xùn)練誤差達(dá)到設(shè)定值;
S39:若S37達(dá)到停止條件,則輸出更新后的參數(shù)集合的值,即模型擬合完成,若沒有達(dá)到,轉(zhuǎn)到S34。
2.根據(jù)權(quán)利要求1所述的熱點(diǎn)話題下多消息互影響的用戶行為預(yù)測系統(tǒng),其特征在于,所述獲取數(shù)據(jù)模塊中,多條消息的相關(guān)數(shù)據(jù)包括消息發(fā)表時(shí)間、轉(zhuǎn)發(fā)路徑,以及平均消息影響力;用戶參與行為數(shù)據(jù)包括參與用戶的個(gè)人信息及歷史行為數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711380240.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





