[發明專利]事件觸發詞的提取方法、電子設備、存儲介質在審
| 申請號: | 202111337761.2 | 申請日: | 2021-11-10 |
| 公開(公告)號: | CN114138980A | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 簡仁賢;李雪婷;吳文杰;劉影 | 申請(專利權)人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/211;G06F40/268;G06F40/289 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
| 地址: | 200030 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 事件 觸發 提取 方法 電子設備 存儲 介質 | ||
本申請提供一種事件觸發詞的提取方法、電子設備、存儲介質,該方法包括:對待處理文本依次進行分詞、詞性標注和依存句法分析,確定每個詞語的句法信息;根據每個詞語的詞性,提取詞性為形容詞的詞語構成第一候選集,詞性為動詞的詞語構成第二候選集,詞性為名詞的詞語構成名詞類候選集;根據每個詞語的句法標簽、詞本身位置和依存節點位置,對第一候選集初步過濾得到形容詞類候選集,對第二候選集初步過濾得到動詞類候選集;將形容詞類候選集、動詞類候選集、名詞類候選集分別按照相應詞類觸發詞規則進行判斷,得到形容詞類觸發詞集、動詞類觸發詞集和名詞類觸發詞集。該方案提高了事件觸發詞提取的準確性。
技術領域
本申請涉及自然語言處理技術領域,特別涉及一種事件觸發詞的提取 方法、電子設備、計算機可讀存儲介質。
背景技術
事件抽取任務是篇章信息抽取的重要子任務,可以分為基于特定領域 的事件抽取和開放域事件抽取這兩種類型。基于特定領域的事件抽取包括 緊急災害事件抽取、就職等事件抽取等。基于領域的事件抽取復用性比較 差、遷移成本比較高、依賴事件類型識別前處理,由于前述問題,開放域 的事件抽取逐漸成了研究的熱點。
在開放域的事件抽取任務中,事件的定義和內部組成成分極為重要。 事件是在一定時空條件下,有若干角色參與,因動作特征而產生了狀態的 改變,具有動態性的語義特征。根據事件的內涵意義,結構化的事件內容 包含事件觸發詞和事件的語義角色,事件觸發詞是事件的核心成分并驅動 管轄這事件的語義角色,大多是動詞詞性,由此可見,事件觸發詞識別的 準確程度對于事件的準確率、召回率甚至性能都是十分關鍵的。
事件抽取本質任務是文本中語義信息的抽取,在詞法、句子結構分析 的基礎上,通常采用語義角色標注的方法來獲取事件中的語義信息。事件 觸發詞的抽取一般依賴于模型對于標注語料的學習,但囿于標注人對于事 件的認知不一、標注語料準確率參差不齊、模型學習效果等,影響到觸發 詞的準確率和一致性,進而影響事件中語義角色的抽取。
發明內容
本申請實施例提供了一種事件觸發詞的提取方法,用以提高觸發詞提 取的準確性。
本申請實施例提供的了一種事件觸發詞的提取方法,該方法包括:
對待處理文本依次進行分詞、詞性標注和依存句法分析,確定每個詞 語的句法信息,所述句法信息包括詞性、句法標簽、詞本身位置和依存節 點位置;所述依存節點位置包括父節點位置和/或子節點位置;
根據每個詞語的詞性,提取詞性為形容詞的詞語構成第一候選集,詞 性為動詞的詞語構成第二候選集,詞性為名詞的詞語構成名詞類候選集;
根據每個詞語的句法標簽、詞本身位置和依存節點位置,對所述第一 候選集初步過濾得到形容詞類候選集,對所述第二候選集初步過濾得到動 詞類候選集;
將所述形容詞類候選集、動詞類候選集、名詞類候選集分別按照相應 詞類觸發詞規則進行判斷,得到形容詞類觸發詞集、動詞類觸發詞集和名 詞類觸發詞集。
在一實施例中,所述根據每個詞語的句法標簽、詞本身位置和依存節 點位置,對所述第一候選集初步過濾得到形容詞類候選集,包括:
根據每個詞語的句法標簽、詞本身位置和依存節點位置,提取所述第 一候選集中帶有HED標簽、COO標簽或VOB標簽的形容詞構成所述形容 詞類候選集。
在一實施例中,所述對所述第二候選集初步過濾得到動詞類候選集, 包括:
根據動詞過濾詞表,刪除所述第二候選集中存在于所述動詞過濾詞表 中的動詞,得到所述動詞類候選集。
在一實施例中,所述將所述形容詞類候選集、動詞類候選集、名詞類 候選集分別按照相應詞類觸發詞規則進行判斷,得到形容詞類觸發詞集、 動詞類觸發詞集和名詞類觸發詞集,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于竹間智能科技(上海)有限公司,未經竹間智能科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111337761.2/2.html,轉載請聲明來源鉆瓜專利網。





