[發明專利]一種基于多模型融合的多元關系抽取方法和抽取系統有效
| 申請號: | 202210009601.3 | 申請日: | 2022-01-05 |
| 公開(公告)號: | CN114925693B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 蔡傳宏;胡沛弦 | 申請(專利權)人: | 華能貴誠信托有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F16/35;G06F40/30;G06N3/047;G06N3/0455 |
| 代理公司: | 北京正理專利代理有限公司 11257 | 代理人: | 張帆 |
| 地址: | 550081 貴州省貴陽市觀山湖區長嶺*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模型 融合 多元 關系 抽取 方法 系統 | ||
1.一種基于多模型融合的多元關系抽取方法,其特征在于,包括:
S1:對輸入的文本進行預處理并使用共享編碼層進行語義特征提取并輸出語義特征向量,進一步包括:
S111:對輸入的文本按照字符拆分為多個字輸入向量,所述字輸入向量包括字向量、段落向量和位置向量;
S112:使用共享編碼層進行語義特征提取并輸出語義特征向量,所述語義特征向量包括第一整體特征向量和多個第二語義特征向量;
S2:分別使用各深度關系模型對所述語義特征向量進行關系抽取并輸出多個關系類型,每個深度關系模型包括用于關系抽取的至少兩個不同結構的關系子模型、以及用于對所述關系子模型的輸出結果進行決策并輸出關系類型的決策單元;
S3:使用關系匯聚單元對各深度關系模型輸出的關系類型進行匯聚并生成關系類型結果。
2.根據權利要求1所述的基于多模型融合的多元關系抽取方法,其特征在于,所述深度關系模型包括第一關系子模型,所述第一關系子模型包括第一枚舉器、第一分類器和第二分類器,
所述S2進一步包括:
S211:使用所述第一枚舉器對所述輸入的文本進行片段枚舉并輸出多個第一實體候選片段;
S212:使用所述第一分類器分別根據各第一實體候選片段的組合向量和所述第一整體特征向量進行運算并輸出多個第一實體向量和多個第一上下文文本特征向量,其中,所述組合向量包括所述第一實體候選片段的文本特征向量、位置向量和寬度向量,所述第一實體向量包括文本特征向量、位置向量和寬度向量;
S213:使用所述第二分類器分別根據所述多個第一實體向量和所述多個第一上下文文本特征向量進行運算并輸出第一關系類型。
3.根據權利要求2所述的基于多模型融合的多元關系抽取方法,其特征在于,
所述S212進一步包括:
S2121:使用所述第一分類器分別根據各第一實體候選片段的組合向量和所述第一整體特征向量進行運算生成第一候選實體;
S2122:使用Softmax判斷所述第一候選實體是否為實體,若所述第一候選實體為實體則輸出第一實體向量;
所述S213進一步包括:使用所述第二分類器分別根據所述多個第一實體向量中的兩個第一實體向量、以及所述兩個第一實體向量之間的所述第一上下文文本特征向量進行兩兩關系分類并生成對應的第一關系類型。
4.根據權利要求2所述的基于多模型融合的多元關系抽取方法,其特征在于,所述第一關系子模型的損失函數為所述第一分類器的損失函數和所述第二分類器的損失函數的加權平均。
5.根據權利要求2所述的基于多模型融合的多元關系抽取方法,其特征在于,所述深度關系模型包括第二關系子模型,所述第二關系子模型包括條件隨機場模型、第三分類器和第四分類器,
所述S2進一步包括:
S221:使用所述條件隨機場模型根據所述語義特征向量進行路徑判斷并輸出識別的多個第二實體向量;
S222:使用所述第三分類器對所述多個第二實體向量進行運算并生成多個第三實體向量和多個第二上下文文本特征向量;
S223:使用所述第四分類器分別根據所述多個第三實體向量中的兩個第三實體向量、所述兩個第三實體向量之間的所述第二上下文文本特征向量、所述兩個第三實體向量中的第一個第三實體向量的位置特征向量、以及所述兩個第三實體向量之間的距離特征向量進行兩兩關系分類并生成對應的第二關系類型。
6.根據權利要求5所述的基于多模型融合的多元關系抽取方法,其特征在于,所述深度關系模型包括第三關系子模型,所述第三關系子模型包括第五分類器和關系抽取器,
所述S2進一步包括:
S231:使用所述第五分類器根據所述語義特征向量進行分類并輸出標注的第四實體向量,所述第四實體向量包括關系主體標識向量、關系客體標識向量和內部標識向量;
S232:使用所述關系抽取器根據所述關系主體標識向量、關系客體標識向量和內部標識向量進行抽取以獲得關系的主體和客體,并根據所述關系的主體和客體輸出第三關系類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華能貴誠信托有限公司,未經華能貴誠信托有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210009601.3/1.html,轉載請聲明來源鉆瓜專利網。





