[發(fā)明專利]事件抽取方法、裝置、設備及存儲介質在審
| 申請?zhí)枺?/td> | 202110301630.2 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN112905868A | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設計)人: | 王炳乾 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/33;G06F40/30;G06F16/35 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 郭棟梁 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 事件 抽取 方法 裝置 設備 存儲 介質 | ||
1.一種事件抽取方法,其特征在于,包括:
獲取待處理文本;
將所述待處理文本輸入到事件檢測模型進行檢測處理,確定所述待處理文本中的事件類型;
基于所述事件類型構建第一問詢語料;
將所述待處理文本和所述第一問詢語料輸入到閱讀理解模型中,確定所述待處理文本中的事件元素;
基于所述事件類型和所述事件元素,確定所述待處理文本的事件抽取結果。
2.根據權利要求1所述的事件抽取方法,其特征在于,所述事件檢測模型包括第一語義提取模型和第一輸出模型,將所述待處理文本輸入到事件檢測模型進行檢測處理,確定所述待處理文本中的事件類型,包括:
將所述待處理文本和預設的所有事件類型按照預設格式進行拼接處理,得到第一拼接文本;
將所述第一拼接文本輸入所述第一語義提取模型中,得到至少一個第一語義向量;
將所述至少一個第一語義向量進行拼接處理,得到第一語義向量序列;
將所述第一語義向量序列通過所述第一輸出模型進行二分類處理,確定所述待處理文本中的事件類型。
3.根據權利要求2所述的事件抽取方法,其特征在于,所述第一語義提取模型包括依次相連的多個變換模型和與每個所述變換模型對應的輸出子模型,將所述第一拼接文本輸入所述第一語義提取模型中,得到至少一個第一語義向量,包括:
對所述第一拼接文本進行編碼處理,確定字嵌入向量和位置嵌入向量;
將所述字嵌入向量和所述位置嵌入向量進行相加,得到輸入向量;
將所述輸入向量通過所述多個變換模型中,得到每個變換模型對應的子輸出向量;
通過與每個變換模型一一對應的輸出子模型,對與每個變換模型相對應的子輸出向量進行分類處理,得到每個所述變換模型對應的子權重向量;
對與所述每個變換模型對應的子權重向量進行歸一化處理,確定總權重向量;
對所述每個變換模型對應的子輸出向量進行拼接處理,確定總輸出向量;
基于所述總輸出向量和所述總權重向量,確定所述第一語義向量。
4.根據權利要求1所述的事件抽取方法,其特征在于,所述閱讀理解模型包括第一模型和與所述第一模型級聯的第二模型,將所述待處理文本和所述第一問詢語料輸入到閱讀理解模型中,確定所述待處理文本中的事件元素,包括:
將所述第一問詢語料和所述待處理文本按照預設格式進行拼接處理,得到第二拼接文本;
將所述第二拼接文本輸入所述第一模型中,確定所述事件類型對應的事件主體;
基于所述事件主體構建第二問詢語料;
將所述第二問詢語料和所述待處理文本按照預設格式進行拼接處理,得到第三拼接文本;
將所述第三拼接文本輸入到所述第二模型中,確定所述事件主體對應的事件元素。
5.根據權利要求4所述的事件抽取方法,其特征在于,所述第一模型包括第二語義提取模型和第二輸出模型,將所述第二拼接文本輸入所述第一模型中,確定所述事件類型對應的事件主體,包括:
將所述第二拼接文本輸入所述第二語義提取模型中,得到至少一個第二語義向量;
將每個所述第二語義向量進行拼接處理,得到第二語義向量序列;
將所述第二語義向量序列通過所述第二輸出模型進行二分類處理,確定事件主體在所述待處理文本中的起始位置和終止位置;
基于所述事件主體在文檔中的起始位置和終止位置,確定所述事件類型對應的事件主體。
6.根據權利要求4所述的事件抽取方法,其特征在于,所述第二模型包括第三語義提取模型和第三輸出模型,將所述第三拼接文本輸入到所述第二模型中,確定所述事件主體對應的事件元素,包括:
將所述第三拼接文本輸入所述第三語義提取模型中,得到至少一個第三語義向量;
將每個所述第三語義向量進行拼接處理,得到第三語義向量序列;
將所述第三語義向量序列通過所述第二輸出子模型進行二分類處理,確定事件元素在所述待處理文本中的邊界;
通過多個二分類網絡對所述邊界進行標注處理,得到所述事件主體對應的事件元素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110301630.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:飛機加油車
- 下一篇:一種智慧水循環(huán)系統





