[發明專利]一種突發事件檢測方法、裝置、設備及存儲介質有效
| 申請號: | 201910092796.0 | 申請日: | 2019-01-30 |
| 公開(公告)號: | CN111507110B | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 王麗宏;賀敏;李晨;毛乾任;司靖輝 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/216;G06Q50/00 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 孟德棟 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 突發事件 檢測 方法 裝置 設備 存儲 介質 | ||
本申請涉及一種突發事件檢測方法、裝置、設備及存儲介質,該方法包括:獲取待檢測事件的文本數據;提取文本數據中的關鍵信息,關鍵信息包括:關鍵詞;根據關鍵信息生成觸發詞關系鏈;在預設的關鍵詞庫與觸發詞關系圖的對應關系中,將與關鍵信息中的關鍵詞對應的觸發詞關系圖確定為目標觸發詞關系圖;計算觸發詞關系鏈和目標觸發詞關系圖的匹配度;若匹配度大于預設匹配閾值,則將待檢測事件確定為突發事件。該方法可以緩解現有技術中存在的突發事件檢測的效率低的問題,達到了提高突發事件檢測效率的技術效果。
技術領域
本申請涉及自然語言處理領域,尤其涉及一種突發事件檢測方法、裝置、設備及存儲介質。
背景技術
隨著移動互聯技術的發展,微博、微信、臉書和推特等社交平臺覆蓋了大量的國內外用戶。社交平臺成為用戶進行情感交流和表達觀點的場所。由于用戶在社交平臺上發布與傳播信息的門檻低、成本低,所以社會性的突發事件極易在社交平臺上快速擴散,破壞社會的穩定性。
在實際應用中,現有技術依靠事件轉發加速度和人工標注進行突發事件的檢測,但是現有技術只有在事件擴散到一定程度的情況下,才能夠檢測到突發事件,在時間上具有延遲性,因此,存在突發事件檢測的效率低的問題。
發明內容
為了解決上述技術問題或者至少部分地解決上述技術問題,本申請提供了一種突發事件檢測方法、裝置、設備及存儲介質。
第一方面,本申請實施例提供了一種突發事件檢測方法,包括:
獲取待檢測事件的文本數據;
提取所述文本數據中的關鍵信息,所述關鍵信息包括:關鍵詞;
根據所述關鍵信息生成觸發詞關系鏈;
在預設的關鍵詞庫與觸發詞關系圖的對應關系中,將與所述關鍵信息中的關鍵詞對應的觸發詞關系圖確定為目標觸發詞關系圖;
計算所述觸發詞關系鏈和所述目標觸發詞關系圖的匹配度;
若所述匹配度大于預設匹配閾值,則將所述待檢測事件確定為突發事件。
可選的,所述關鍵信息還包括:命名實體,所述根據所述關鍵信息生成觸發詞關系鏈,包括:
將所述關鍵信息中的關鍵詞和命名實體組合成與所述文本數據對應的結構化文本;
根據所述結構化文本確定相互關聯的至少兩個事件片段;
按照所述事件片段發生的順序,將相互關聯的所述事件片段進行連接,得到事件片段鏈;
分別提取所述事件片段鏈中的每個事件片段的觸發詞;
按照所述事件片段發生的順序,將與各個所述事件片段分別對應的觸發詞進行連接,得到所述觸發詞關系鏈。
可選的,所述計算所述觸發詞關系鏈和所述目標觸發詞關系圖的匹配度,包括:
獲取所述觸發詞關系鏈的結點總數;
將所述觸發詞關系鏈和所述目標觸發詞關系圖進行匹配;
統計所述觸發詞關系鏈中、與所述目標觸發詞關系圖相匹配的結點的數量,得到匹配結點數;
將所述匹配結點數除以所述結點總數,計算得到所述匹配度。
第二方面,本申請實施例提供了一種突發事件檢測方法,包括:
獲取多個新聞文本;
利用預設的關鍵詞庫與事件主題之間的對應關系,將多個所述新聞文本劃分成多個新聞文本集合,每個所述新聞文本集合分別對應一個事件主題;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910092796.0/2.html,轉載請聲明來源鉆瓜專利網。





