[發明專利]實體關系的抽取方法及裝置、電子設備、存儲介質在審
| 申請號: | 202111153354.6 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113792122A | 公開(公告)日: | 2021-12-14 |
| 發明(設計)人: | 丁銳 | 申請(專利權)人: | 中國銀行股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F40/126;G06N3/04;G06N3/08;G06N7/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 秦曉君 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 關系 抽取 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種實體關系的抽取方法及裝置、電子設備、存儲介質,可應用于金融領域或其他領域,其中,所述方法包括:獲取目標文本;將所述目標文本輸入預訓練語言表征模型Bert中,通過所述預訓練語言表征模型Bert對所述目標文本進行處理,得到所述目標文本對應的編碼;將所述目標文本對應編碼輸入預先訓練好的目標神經網絡模型中,通過所述目標神經網絡模型抽取出所述目標文本中的各類關系數據,并基于所述目標文本的關系數據,抽取出所述目標文本中的各個實體數據;其中,所述目標神經網絡模型預先利用多個文本樣本及其對應的關系標注和實體標注進行訓練得到;所述文本樣本對應的關系標注和實體標注,均基于確定出的數據結構模式schema進行標注。
技術領域
本申請涉及數據抽取技術領域,特別涉及一種實體關系的抽取方法及裝置、電子設備、存儲介質。
背景技術
現在為了便于對數據進行關聯,也便于直觀的獲取數據之間的管理關系,現今通常會利用數據庫中的數據構建成相應的知識圖譜。在利用已有的數據構建相應的知識圖譜時,需要從數據中提取出實體以及實體間的關系,在基于實體以及實體間的關系,構建出知識圖譜。
現有從文本數據中提取出實體間的關系以及實體的方式,主要是通過命名實體的方式抽取實體,并且通過指定的關系從文本數據中提取出實體間的關系。
但是這種方式,分別是對實體與實體間的關系進行抽取,沒有充分利用實體識別與關系抽取的相關性,所以抽取到的結果的準確性較低。
發明內容
基于上述現有技術的不足,本申請提供了一種實體關系的抽取方法及裝置、電子設備、存儲介質,以解決現有的實體關系抽取方式的準確性較低的問題。
為了實現上述目的,本申請提供了以下技術方案:
本申請第一方面提供了一種實體關系的抽取方法,包括:
獲取目標文本;
將所述目標文本輸入預訓練語言表征模型Bert中,通過所述預訓練語言表征模型Bert對所述目標文本進行處理,得到所述目標文本對應的編碼;
將所述目標文本對應編碼輸入預先訓練好的目標神經網絡模型中,通過所述目標神經網絡模型抽取出所述目標文本中的各類關系數據,并基于所述目標文本的關系數據,抽取出所述目標文本中的各個實體數據;其中,所述目標神經網絡模型預先利用多個文本樣本及其對應的關系標注和實體標注進行訓練得到;所述文本樣本對應的關系標注和實體標注,均基于確定出的數據結構模式schema進行標注。
可選地,在上述的實體關系的抽取方法中,所述目標神經網絡模型包括第一神經網絡模型以及第二神經網絡模型,所述將所述目標文本對應編碼輸入預先訓練好的目標神經網絡模型中,通過所述目標神經網絡模型抽取出所述目標文本中的各類關系數據,并基于所述目標文本的關系數據,抽取出所述目標文本中的各個實體數據,包括:
將所述目標文本對應編碼輸入所述第一神經網絡模型中,通過所述第一神經網絡模型對所述目標文本對應的編碼進行處理,得到所述目標文本中的各類關系數據;其中,所述第一神經網絡模型預先利用所述文本樣本及其對應的關系標注進行訓練得到;
將所述目標文本中的各類關系數據輸入所述第二神經網絡模型中,通過所述第二神經網絡模型對所述目標文本中的關系數據進行處理,得到所述目標文本中的各個實體數據;其中,所述第二神經網絡模型預先利用所述文本樣本及其對應的實體標注進行訓練得到。
可選地,在上述的實體關系的抽取方法中,所述第一神經網絡模型由雙向長短時記憶模型Bi-LSTM和邏輯回歸模型Softmax組成,所述第二神經網絡模型由預訓練語言表征模型Bert、雙向長短時記憶模型Bi-LSTM、條件隨機場模型CRF以及邏輯回歸模型Softmax組成。
可選地,在上述的實體關系的抽取方法中,所述第一神經網絡模型的訓練方法,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀行股份有限公司,未經中國銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111153354.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種壓縮機自力式旋轉密封系統及密封方法
- 下一篇:一種配電柜





