[發明專利]一種基于深度學習技術的新聞子事件預測方法及裝置在審
| 申請號: | 201710161795.8 | 申請日: | 2017-03-17 |
| 公開(公告)號: | CN107122347A | 公開(公告)日: | 2017-09-01 |
| 發明(設計)人: | 李涓子;胡琳梅 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06N3/08 |
| 代理公司: | 北京路浩知識產權代理有限公司11002 | 代理人: | 湯財寶 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 技術 新聞 事件 預測 方法 裝置 | ||
技術領域
本發明涉及情報分析技術領域,更具體地,涉及一種基于深度學習技術的新聞子事件預測方法及裝置。
背景技術
目前,新聞事件是指發生在特定時間和地點的一件或一系列事情,同時一個新聞事件通常是由一系列有序的子事件構成。例如,一個地震事件通常包含了地震的發生、地震的人員傷亡、地震的財務損失、震后救援、震后捐款援助、震后災區重建等一系列的子事件。一個子事件通常由一篇新聞報道來描述。
目前為止,成千上萬的新聞事件及其子事件的發展過程已經被報道并且記錄。可以通過利用大規模的歷史事件來預測一系列子事件的下一個子事件。通過上述科學的預測,可以有效的提前預測某個新聞事件的一系列子事件,這個對政府部門、企業和新聞機構及時準確獲取咨詢都非常重要。例如,政府部門可以受益于事件預測,避免一些經濟損失和人員傷亡;企業可以更好的進行危機應對方案的提前準備;新聞機構可以緊密關注社會公眾可能感興趣的新的話題并及時進行報道等等。
然而,傳統的新聞子事件預測方法通過利用社會媒體和搜索引擎來檢測事件并進行人為判斷,并沒有花費大量的精力在事件預測上。但是,也有個別技術對于子事件的預測進行了研究。Radinsky et al.(2012)通過抽取事件之間的因果關系并且用本體進行泛化用于事件預測;Granroth-Wilding et al.(2016)從文本中抽取事件鏈并且通過一個組合神經網絡學習兩個事件之間的關聯關系;Manshadi et al.(2008)學習了事件序列的概率模型;Karl et al.(2016)描述了一個用LSTM學習腳本的方法。
然而,上述的新聞子事件預測技術都存在以下幾個問題:1、需要人工的特征來表示事件并且只能預測在訓練集中存在的事件;2、沒有考慮事件表現出來不同粒度上的序列結構:描述一個具體子事件的詞形成了一個序列,屬于同一個事件的子事件形成了一個序列;3、沒有考慮利用已有的子事件中存在的話題信息。
發明內容
本發明為克服上述問題或者至少部分地解決上述問題,提供一種基于深度學習技術的新聞子事件預測方法及裝置。
根據本發明的一個方面,提供一種新聞子事件預測方法,包括:
步驟1,基于預處理過的大規模子事件序列數據,利用LSTM深度學習技術對子事件進行表示學習,獲得子事件模型;
步驟2,基于所述子事件模型和子事件主題,對子事件序列進行表示學習,獲得子事件序列模型;
步驟3,利用所述子事件序列模型對下一個子事件進行預測。
根據本發明的另一個方面,提供一種新聞子事件預測裝置,包括子事件建模模塊、子事件序列建模模塊和預測模塊:
所述子事件建模模塊與所述子事件序列建模模塊相連,用于基于預處理過的大規模子事件序列數據,利用LSTM深度學習技術對子事件進行表示學習,獲得子事件模型;
所述子事件序列建模模塊分別于所述子事件建模模塊和預測模塊相連,用于基于所述子事件模型和子事件主題,對子事件序列進行表示學習,獲得子事件序列模型;
所述預測模塊與所述子事件序列建模模塊相連,用于利用所述子事件序列模型對下一個子事件進行預測。
本申請提出一種基于深度學習技術的新聞子事件預測方法及裝置,本發明能夠有效地實現子事件預測功能,甚至能夠預測在訓練中語料中不存在的子事件,比當前最先進的方法能獲得更好的預測效果。
附圖說明
圖1為根據本發明實施例一種新聞子事件預測方法的整體流程示意圖;
圖2為根據本發明實施例一種新聞子事件預測方法的流程示意圖;
圖3為根據本發明實施例一種新聞子事件預測方法中事件雙層序列的示意圖;
圖4為根據本發明實施例一種新聞子事件預測裝置的整體框架示意圖。
具體實施方式
下面結合附圖和實施例,對本發明的具體實施方式作進一步詳細描述。以下實施例用于說明本發明,但不用來限制本發明的范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710161795.8/2.html,轉載請聲明來源鉆瓜專利網。





