[發明專利]一種文本事件元素提取方法在審
| 申請號: | 202011510822.6 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112541341A | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 蘇華權;周昉昉;廖鵬;蔡雄;易仕敏;彭澤武;楊秋勇 | 申請(專利權)人: | 廣東電網有限責任公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/30 |
| 代理公司: | 北京世譽鑫誠專利代理有限公司 11368 | 代理人: | 任欣生 |
| 地址: | 510000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 事件 元素 提取 方法 | ||
1.一種文本事件元素提取方法,其特征在于,包括:
將文本輸入訓練過的第一序列標注BERT模型,得到多個觸發詞;
將所述多個觸發詞及所述多個觸發詞所在的文本輸入訓練過的第二序列標注BERT模型,得到所述多個觸發詞對應的事件元素,生成事件元素集合,其中,所述事件元素包括事件主體、事件客體、時間及地點。
2.根據權利要求1所述的文本事件元素提取方法,其特征在于,在生成事件元素集合之后,所述方法還包括:
利用語言技術平臺ltp模型,得到所述觸發詞與所述各個事件元素之間的句法依存關系;
根據所述句法依存關系,分別判斷所述各個事件元素是否正確。
3.根據權利要求2所述的文本事件元素提取方法,其特征在于,根據所述句法依存關系,分別判斷所述各個事件元素是否正確包括:
當所述句法依存關系為主謂關系的主語,通過人工判斷所述事件元素中相應的事件主體在所述文本中是否真的為事件主體,如果不是,則過濾所述事件元素。
4.根據權利要求2所述的文本事件元素抽取方法,其特征在于,根據所述句法依存關系,分別判斷所述各個事件元素是否正確還包括:
當所述句法依存關系為動賓關系的主語,通過人工判斷所述事件元素中相應的事件客體在所述文本中是否真的為事件客體,如果不是,則過濾所述事件元素。
5.根據權利要求1所述的文本事件元素抽取方法,其特征在于,所述序列標注BERT模型的訓練過程包括:
將攜帶觸發詞標簽的多個句子級文本作為訓練數據輸入序列標注BERT模型,對所述序列標注BERT模型進行訓練,得到訓練過的第一序列標注BERT模型。
6.根據權利要求1所述的文本事件元素抽取方法,其特征在于,所述第二序列標注BERT模型的訓練過程包括:
將條件隨機場CRF模型的CRF層添加至訓練過的序列標注BERT模型,得到訓練過的第二序列標注BERT模型。
7.根據權利要求6所述的文本事件元素抽取方法,其特征在于,所述序列標注BERT模型的訓練過程包括:
將攜帶事件元素標簽的多個句子級文本作為訓練數據輸入序列標注BERT模型,對所述序列標注BERT模型進行訓練,得到訓練過的第二序列標注BERT模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司,未經廣東電網有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011510822.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鎖邊結構、應用鎖邊結構的衣服及制造工藝
- 下一篇:一種多用途蜂巢簾





