[發(fā)明專利]一種針對突發(fā)事件的事件知識圖譜構建方法有效
| 申請?zhí)枺?/td> | 202110467741.0 | 申請日: | 2021-04-28 |
| 公開(公告)號: | CN113312490B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設計)人: | 孫銳;謝紅 | 申請(專利權)人: | 樂山師范學院 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/30 |
| 代理公司: | 西安銘澤知識產(chǎn)權代理事務所(普通合伙) 61223 | 代理人: | 張舉 |
| 地址: | 614000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 突發(fā)事件 事件 知識 圖譜 構建 方法 | ||
本發(fā)明提供了一種針對突發(fā)事件的事件知識圖譜構建方法,屬于自然語言處理領域,包括以下步驟:1)從互聯(lián)網(wǎng)上收集新聞文檔數(shù)據(jù),完成數(shù)據(jù)清洗等預處理操作;2)將語料加入背景語料,預訓練后習得詞的嵌入表示;3)以語句為單位,抽取原子事件;4)針對事件表現(xiàn)形式多樣化的問題,進行原子事件的規(guī)范化;5)對出現(xiàn)在同一語句中的事件對,識別其時序關系;6)基于事件和事件時序關系構建事件知識圖譜。該方法利用原子事件及原子事件關系進行統(tǒng)計分析,有效地從事件關聯(lián)性中進行推理和預測,以便對突發(fā)事件進行預防或輔助決策。
技術領域
本發(fā)明屬于自然語言處理領域,具體涉及一種針對突發(fā)事件的事件知識圖譜構建方法。
背景技術
突發(fā)事件,是指突然發(fā)生,造成或者可能造成嚴重社會危害,需要采取應急處置措施予以應對的自然災害、事故災難、公共衛(wèi)生事件和社會安全事件。為預防和減少突發(fā)事件的發(fā)生,控制、減輕和消除突發(fā)事件引起的嚴重社會危害,相關部門應規(guī)范突發(fā)事件應對活動,對可能發(fā)生的突發(fā)事件進行綜合性評估,最大限度地減輕重大突發(fā)事件影響。
突發(fā)事件具有明顯的時序特征,往往會演化或衍生出很多的子事件。例如,一些臺風事件一發(fā)生,同時會出現(xiàn)“人員傷亡”、“農(nóng)作物受災”、“通訊中斷”等事件;隨著時間的推進,“氣象臺發(fā)布預警”、“相關部門發(fā)出通告”、“轉移相關人員”、“防范病菌”等一系列相關事件。這些事件的發(fā)生有著時序關系或因果關系。準確完整地獲取突發(fā)事件關系,對了解突發(fā)事件的前因后果以及對事態(tài)發(fā)展趨勢的掌握有著重要的作用。
自某網(wǎng)站推出第一版知識圖譜(Knowledge?Graph,KG)以來,知識圖譜已在工業(yè)界和學術界掀起了一股熱潮。知識圖譜采用實體二元關系描述現(xiàn)實世界,以圖數(shù)據(jù)結構來表達和存儲知識,其實體關系類別或關注開放領域下的“Is?a”和“Attribute”類型,或針對特定領域定制語義框架。
事件,一般指一個動作的發(fā)生或狀態(tài)的變化。與實體關系相比,事件作為一種特殊的知識表現(xiàn)形式,呈現(xiàn)了比實體關系更復雜的語義關系。從認知心理學來看,人類多以“事件”為單位去記憶和理解現(xiàn)實世界。現(xiàn)實世界中的事件之間大多呈現(xiàn)因果和時序上的關系。采用原子事件知識圖譜比傳統(tǒng)知識圖譜更利于進行突發(fā)事件的分析和預測。在所構造的事件知識圖譜中,結點本身包含論元(可以為實體)間的語義關系,而邊則表達了事件間的關系,因而包含了比傳統(tǒng)知識圖譜更豐富的知識。同一主題下的事件會形成天然的聚簇,即事件關聯(lián)子圖或事件鏈。事件在不同主題下往往呈現(xiàn)了不同的強度或主題相關度,事件之間也有著不同的關聯(lián)度。因此,基于事件知識圖譜開展事件強度、事件關聯(lián)度、事件鏈等知識推理研究并實現(xiàn)時間線生成和事件預測等應用是非常有意義的。
近年來,知識圖譜的發(fā)展如火如荼,F(xiàn)reebase和Probase等英文知識圖譜已得到廣泛的應用。但它們只包含了有關實體的豐富知識,極少涉及事件知識。現(xiàn)有面向突發(fā)事件的知識圖譜構建方法采用傳統(tǒng)的以實體為基本結點的形式,語義表達能力有限且語義關系略為簡單,難以刻畫客觀世界動態(tài)性的知識。例如,“地震”發(fā)生后,往往會有“傷亡”、“救援”和“安置”等事件發(fā)生;同樣,“CEO辭職”發(fā)生后也可能會出現(xiàn)“人事變更”和“股市起伏”等相關事件。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術存在的不足,本發(fā)明提供了一種針對突發(fā)事件的事件知識圖譜構建方法。
為了實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
一種針對突發(fā)事件的事件知識圖譜構建方法,包括以下步驟:
步驟1、收集突發(fā)事件新聞文檔,對突發(fā)事件新聞文檔進行數(shù)據(jù)預處理操作,得到新聞數(shù)據(jù)集D;
步驟2、將預處理后的新聞數(shù)據(jù)集D加入背景語料,預訓練后得到詞的分布式表示,即詞的Embedding;
步驟3、對新聞數(shù)據(jù)集D中的每篇新聞,以語句為單位采用深度學習的序列標注方法進行事件抽取,所對應的事件采用主謂賓結構的三元組原子事件表示;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于樂山師范學院,未經(jīng)樂山師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110467741.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





