[發明專利]一種面向社交網絡的熱點事件預測方法有效
| 申請號: | 202111032195.4 | 申請日: | 2021-09-03 |
| 公開(公告)號: | CN113806534B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 田玲;許毅;惠孛;張栗粽;羅光春;冀柯曦;樊美琦 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/34;G06F40/289;G06N3/042;G06N3/0464;G06N3/048;G06Q10/04;G06Q50/00 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 甘茂 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 社交 網絡 熱點 事件 預測 方法 | ||
本發明屬于熱點事件預測技術領域,具體提供一種面向社交網絡的熱點事件預測方法,用以解決現有技術中文本數據價值挖掘不夠、動態時序特征與上下文語義信息利用不充分等技術問題。本發明首先,基于圖卷積神經網絡捕捉文本鄰域語義信息,能夠充分挖掘關鍵詞語之間的依存關系;其次,提出維度注意力機制,改進圖神經網絡的動態分層傳播方式,通過維度注意力機制生成重點特征摘要,并將其用于縮放原特征,自適應地調整各個維度特征響應值,增加事件預測中有價值詞語的權重,同時抑制價值較弱詞語的權重,即充分捕捉社交網絡文本時變信息;最終,基于關鍵詞語鄰域信息與時序信息充分挖掘文本數據價值,提高模型預測的準確率,具有實用價值。
技術領域
本發明屬于熱點事件預測技術領域,涉及圖神經網絡在熱點事件預測技術中的應用,具體提供一種面向社交網絡數據的基于動態圖神經網絡的熱點事件預測方法。
背景技術
如今,社交網絡已經逐漸滲入人們生活各個方面,包括社會、政治和經濟等;社交網絡開放性強、信息傳播迅速,吸引了海量用戶,成為公眾發布社會消息、討論現實事件的重要渠道;社交網絡事件通常是現實事件在網絡空間的映射,大量研究人員展開面向社交網絡的熱點事件預測研究。有學者從數學上將熱點事件預測問題定義為預測一個可觀測的事件在未來是否會成為熱點,目前研究面向社交網絡的熱點事件預測任務主要包含以下三類:預測網絡事件是否成為熱點、預測事件在某個時間熱度值、預測事件變熱的概率,根據預測方法的不同將其分為基于傳統機器學習和基于深度學習兩種方法。
Suh等人針對單條推文流行度預測問題,基于用戶信息、文本內容,利用主成分分析(PCA)與廣義線性模型(GLM)尋找早期特征與轉發數量之間的關系。Zhang等人則選擇事件相關文本,用戶興趣、影響力以及歷史流行度實現流行度線性函數建模,解決事件下一時刻流行度預測問題。目前現有研究事件預測問題大多圍繞用戶屬性、級聯關系等特征,較少研究考慮利用文本信息對熱度變化進行建模。Geng等人提出一種基于推特數據的時空事件預測生成模型,該模型通過對結構背景和時空突發性聯合建模,刻畫未來事件的潛在發展。Deng等人提出的動態圖卷積神經網絡(DGCN)利用事件上下文,以動態圖結構形式對節點信息建模,揭示節點之間隱藏的關聯信息,分析單詞之間隱藏時序聯系,能夠影響未來事件預測效果。
社交網絡用戶之間相互關注,構成錯綜復雜的網絡結構,信息傳播演變模式更加復雜,數據具有多維、多源和異構等特點,現有方法主要利用機器學習方法?;趥鹘y機器學習方法多是特征驅動的,許多特征是由專家根據先驗知識而精心設計的,該類方法性能較多依賴于特征表示,但沒有明確統一設計、測量特征原則,存在丟失重要信息的可能性。而基于深度學習方法可解釋性較差,難以直觀描述事件熱度變化的原因,不能充分捕捉社交網絡中信息時變的活躍水平。此外,用戶發布在社交網絡的信息以文本內容為主,在以往針對熱度預測問題的研究中,通常利用的文本信息只有事件或話題名稱,沒有充分利用社交網絡文本數據;并且,文本數據價值稀疏,難以從中挖掘潛在有價值信息,事件文本內容更是隨時間動態變化,應該充分考慮其時序特征。
發明內容
本發明的目的在于提供一種面向社交網絡數據的基于圖神經網絡的熱點事件預測方法,用以解決現有技術中文本數據價值挖掘不夠、動態時序特征與上下文語義信息利用不充分等技術問題。
為實現上述目的,本發明采用的技術方案如下:
一種面向社交網絡的熱點事件預測方法,包括以下步驟:
步驟1、對源數據進行數據預處理得到文本數據,并對每條文本數據進行0、1分類標記,獲得樣本數據;
步驟2、根據預定時序將樣本數據構建為帶有節點特征的時序圖結構數據,利用圖卷積神經網絡對時序圖結構數據進行處理,通過圖卷積模塊進行卷積操作,獲得聚合關鍵詞語鄰域信息的文本特征向量;
步驟3、通過維度注意力機制對步驟2所得文本特征向量進行編碼,捕捉其時序相關性,獲得聚合關鍵詞語鄰域信息與時序信息的文本特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111032195.4/2.html,轉載請聲明來源鉆瓜專利網。





