[發明專利]用語義迭代提取網絡突發事件并識別外延事件關系的方法在審
| 申請號: | 201710679941.6 | 申請日: | 2017-08-10 |
| 公開(公告)號: | CN107480137A | 公開(公告)日: | 2017-12-15 |
| 發明(設計)人: | 林飛;洪秋月;趙喜榮;熊驍;毛俊 | 申請(專利權)人: | 北京亞鴻世紀科技發展有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100082 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用語 義迭代 提取 網絡 突發事件 識別 外延 事件 關系 方法 | ||
1.用語義迭代提取網絡突發事件并識別外延事件關系的方法,其特征在于包含事件觸發詞提取步驟,外延事件主題集合步驟,外延事件關系識別步驟,其中外延事件關系識別步驟包括了迭代抽取流程,迭代抽取流程使用Hearst Pattern算法;觸發詞提取步驟由分詞,句法樹建立,建立句法路徑,提取觸發詞系列過程完成;外延事件主題集合步驟由事件元素識別,事件的表示,LDA聚類系列過程完成;外延事件關系識別步驟經過事件表示對主實體識別和外延實體識別進行迭代抽取,最終得到事件關系推理結果;
實現用語義迭代提取網絡突發事件并識別外延事件關系的方法的具體步驟如下:
1).事件觸發詞提取步驟
(1)分詞:利用HanLp對在句級層面上對事件進行分詞;
(2)句法樹建立:將分詞后的數據輸入Standford Parser建立句子的語法樹型結構,此處值得注意的需要是基于已有的樹形結構進句法分析;
(3) 建立句法路徑:根據樹結構建立句法路徑:“NN”表示句法樹節點,“↓”表示前一節點是后一節點的父節點,“↑”表示前一節點是后一節點的子節點;泛化后的句法路徑可表示為[NT↑…↑NT↓…↓NT front( back) ],其中NT 表示句法樹中任意非終結符號; front 表示在這條句法路徑中,觸發詞位于最左邊; back表示觸發詞位于最右邊;依據句法路徑找到觸發詞;
2).外延事件主題集合步驟
(1)事件元素識別:事件元素識別使用優化后的ACE2005的定義,優化ACE2005中定義的8種事件類別以及33種子類別,將時間即time加入到每個事件類別中;
(2)事件的表示:在完成事件元素識別的前提下,將句子表示成一個事件元素組成的單元,舉例說明例如:Lif/Die事件類型包含time,victim,place,instrument四個要素,這個類別的事件可以表示為;
(3)LDA聚類:定義外延事件只存在于在同類事件當中,外延事件與原事件本身是存在依賴關系的,用LDA聚類算法將事件聚類;
3).外延事件關系識別步驟
(1)事件的表示:根據事件表示找到語義詞;
(2)主實體識別和外延實體識別:根據分組的語義詞進行主實體和外延實體的識別,主實體和外延實體都來源于觸發詞和部分事件元素,定義當事件的觸發詞和事件元素為外延實體,那么此事件為外延事件;
(3)Hearst Pattern算法:
輸入:句子的Hearst Pattern
輸出:,外延事件集合
1.
2.repeat
3.foreachdo
4.
5.ifthen
6.
7.end
8.ifthen
9.
10.foreachdo
11.
12.if
13.add to
14.end
15.End。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京亞鴻世紀科技發展有限公司,未經北京亞鴻世紀科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710679941.6/1.html,轉載請聲明來源鉆瓜專利網。





