[發(fā)明專利]社會(huì)網(wǎng)絡(luò)信息傳播行為預(yù)測(cè)方法和設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201710476335.4 | 申請(qǐng)日: | 2017-06-21 |
| 公開(公告)號(hào): | CN107391581A | 公開(公告)日: | 2017-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 薛一波;楊駿;王兆國(guó) | 申請(qǐng)(專利權(quán))人: | 清華大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司11002 | 代理人: | 王瑩,曹杰 |
| 地址: | 100084 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 社會(huì) 網(wǎng)絡(luò) 信息 傳播 行為 預(yù)測(cè) 方法 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù),具體涉及社會(huì)網(wǎng)絡(luò)信息傳播行為預(yù)測(cè)方法和設(shè)備。
背景技術(shù)
隨著信息技術(shù)的發(fā)展,Internet在全球范圍內(nèi)得到廣泛應(yīng)用,社會(huì)網(wǎng)絡(luò)逐漸成為信息傳播的重要媒介之一。社會(huì)網(wǎng)絡(luò)的迅速普及方便了人們交流溝通以及信息傳播。截至2016年末,全球最大的在線社會(huì)網(wǎng)絡(luò)Facebook月活躍用戶人數(shù)已達(dá)18.6億,與此同時(shí),中國(guó)較具有代表性的社會(huì)網(wǎng)絡(luò)新浪微博月活躍用戶數(shù)也達(dá)到3.13億。在信息傳播的過(guò)程中,用戶是信息的制造者、發(fā)布者、傳播者、接收者和評(píng)價(jià)者,用戶參與程度加深、參與頻率加快、參與熱情加大,成為網(wǎng)絡(luò)輿論形式中不可或缺的一部分。
當(dāng)前社會(huì)網(wǎng)絡(luò)上的信息傳播呈現(xiàn)出渠道多樣化、傳播速度快、規(guī)模范圍廣等現(xiàn)象,給信息的傳播分析帶來(lái)了新的挑戰(zhàn)。為保障在線社會(huì)網(wǎng)絡(luò)的健康環(huán)境,對(duì)于正面信息,需要采取措施盡可能提高傳播速度和擴(kuò)大受眾范圍;對(duì)于負(fù)面信息則需要采取措施盡可能控制其傳播擴(kuò)散。因此迫切需要及時(shí)、有效、準(zhǔn)確的對(duì)社會(huì)網(wǎng)絡(luò)信息傳播進(jìn)行預(yù)測(cè),及時(shí)把控信息傳播規(guī)律。
為了解決這類問(wèn)題,各領(lǐng)域的研究人員開始致力于這方面的研究,試圖發(fā)現(xiàn)社會(huì)網(wǎng)絡(luò)信息傳播的關(guān)鍵影響因素,應(yīng)用于社會(huì)網(wǎng)絡(luò)信息傳播行為預(yù)測(cè)。然而,現(xiàn)有的研究無(wú)法評(píng)估用戶在傳播同一源信息時(shí)不同情感傾向?qū)π畔⒑罄m(xù)傳播的影響。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,本發(fā)明提出了克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的社會(huì)網(wǎng)絡(luò)信息傳播行為預(yù)測(cè)方法和設(shè)備。
為此目的,第一方面,本發(fā)明提出一種社會(huì)網(wǎng)絡(luò)信息傳播行為預(yù)測(cè)方法,包括以下步驟:
S101、從待分析社會(huì)網(wǎng)絡(luò)上獲取文本信息和信息傳播關(guān)系,根據(jù)信息傳播關(guān)系構(gòu)建實(shí)時(shí)信息傳播拓?fù)洌?/p>
S102、基于種子情感詞典對(duì)文本信息進(jìn)行預(yù)處理,從文本信息中提取特征詞,運(yùn)用機(jī)器學(xué)習(xí)算法對(duì)特征詞進(jìn)行語(yǔ)料情感分類,獲得用戶情感類別;
S103、分析實(shí)時(shí)信息傳播拓?fù)渲械挠脩羯缃惶卣鳌⑿畔?nèi)容特征、時(shí)間特征及傳播結(jié)構(gòu)特征;
S104、根據(jù)得到的用戶情感類別,以及用戶社交特征、信息內(nèi)容特征、時(shí)間特征及傳播結(jié)構(gòu)特征,運(yùn)用機(jī)器學(xué)習(xí)算法對(duì)信息傳播的規(guī)模、速度及活躍周期進(jìn)行預(yù)測(cè)。
可選的,所述步驟S101包括:
S201、從待分析社會(huì)網(wǎng)絡(luò)上,根據(jù)發(fā)布源信息的源節(jié)點(diǎn)獲取第一信息轉(zhuǎn)發(fā)列表;第一信息轉(zhuǎn)發(fā)列表包括轉(zhuǎn)發(fā)節(jié)點(diǎn)的第二信息轉(zhuǎn)發(fā)列表;
S202、將源節(jié)點(diǎn)根節(jié)點(diǎn),以及根據(jù)第一信息轉(zhuǎn)發(fā)列表構(gòu)建實(shí)時(shí)信息傳播拓?fù)洌?/p>
S203、獲得源節(jié)點(diǎn)的用戶屬性和基本屬性,獲得轉(zhuǎn)發(fā)節(jié)點(diǎn)的轉(zhuǎn)發(fā)屬性和用戶屬性;
轉(zhuǎn)發(fā)屬性至少包括:轉(zhuǎn)發(fā)用戶ID、轉(zhuǎn)發(fā)評(píng)論內(nèi)容、轉(zhuǎn)發(fā)時(shí)間、轉(zhuǎn)發(fā)信息點(diǎn)贊數(shù)、轉(zhuǎn)發(fā)信息再次轉(zhuǎn)發(fā)量;
用戶屬性至少包括:轉(zhuǎn)發(fā)用戶ID、轉(zhuǎn)發(fā)用戶昵稱、轉(zhuǎn)發(fā)用戶個(gè)人介紹內(nèi)容、轉(zhuǎn)發(fā)用戶歷史發(fā)表信息數(shù)、轉(zhuǎn)發(fā)用戶關(guān)注人數(shù)、轉(zhuǎn)發(fā)用戶被關(guān)注人數(shù)、轉(zhuǎn)發(fā)用戶性別、轉(zhuǎn)發(fā)用戶是否被認(rèn)證;
源頭信息的基本屬性至少包括:源頭用戶ID、源頭信息內(nèi)容、源頭信息發(fā)表時(shí)間、源頭信息點(diǎn)贊數(shù)、源頭信息轉(zhuǎn)發(fā)量;
可選的,所述文本信息包括轉(zhuǎn)發(fā)屬性的轉(zhuǎn)發(fā)評(píng)論內(nèi)容和源頭信息內(nèi)容;
所述步驟S102包括:
S301、標(biāo)定細(xì)粒度種子情感詞典并賦予情感得分;
S302、基于種子情感詞典處理文本信息,得到情感語(yǔ)料集;
S303、基于情感語(yǔ)料集進(jìn)行分詞,并進(jìn)行特征選擇,只保留對(duì)情感分類貢獻(xiàn)較大的詞語(yǔ),壓縮語(yǔ)料生成特征向量的特征維數(shù);
S304、基于特征向量集訓(xùn)練機(jī)器學(xué)習(xí)分類器;
S305、使用步驟S304獲得的機(jī)器學(xué)習(xí)分類器對(duì)文本進(jìn)行情感分類,確定源頭信息內(nèi)容和轉(zhuǎn)發(fā)評(píng)論內(nèi)容的用戶情感類別。
可選的,所述用戶社交特征至少包括:用戶名文本長(zhǎng)度、個(gè)人介紹文本長(zhǎng)度、用戶歷史發(fā)表信息數(shù)、用戶關(guān)注人數(shù)、用戶被關(guān)注人數(shù)、用戶性別、用戶是否被認(rèn)證;
所述信息內(nèi)容特征至少包括:信息文本長(zhǎng)度、包含表情數(shù)、包含標(biāo)簽數(shù)、包含提及數(shù);
所述時(shí)間特征至少包括:源頭信息發(fā)表時(shí)刻、轉(zhuǎn)發(fā)信息發(fā)表時(shí)刻、轉(zhuǎn)發(fā)行為距上層轉(zhuǎn)發(fā)時(shí)間間隔、轉(zhuǎn)發(fā)行為距源頭信息發(fā)表時(shí)間間隔;
所述傳播結(jié)構(gòu)特征至少包括:轉(zhuǎn)發(fā)信息深度、傳播拓?fù)渖疃取⑵骄?jié)點(diǎn)深度、節(jié)點(diǎn)度分布標(biāo)準(zhǔn)差、傳播樹最大子樹規(guī)模占比、平均節(jié)點(diǎn)距離、模塊度。
第二方面,本發(fā)明提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一所述方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710476335.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





