[發明專利]基于神經網絡的關系抽取數據生成方法、模型及訓練方法有效
| 申請號: | 201910922416.1 | 申請日: | 2019-09-26 |
| 公開(公告)號: | CN110704547B | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 陳棟;齊云飛;付驍弈 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06N3/08 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 王文紅 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 關系 抽取 數據 生成 方法 模型 訓練 | ||
1.一種基于神經網絡的關系抽取數據生成方法,其特征在于,應用于關系抽取數據生成模型,所述方法包括:
獲取由三元組信息確定出的輸入信息,其中,所述輸入信息包括詞嵌入、關系類型嵌入、實體類型嵌入、位置嵌入和掩碼;
根據所述輸入信息,確定出多條包含所述三元組信息的文本數據;
輸出多條所述文本數據中的k條所述文本數據,其中,k為大于1的整數。
2.根據權利要求1所述的基于神經網絡的關系抽取數據生成方法,其特征在于,所述輸入信息由詞嵌入矩陣、關系類型嵌入矩陣、實體類型嵌入矩陣、位置嵌入矩陣和掩碼矩陣確定出,其中,所述詞嵌入矩陣、所述關系類型嵌入矩陣、所述實體類型嵌入矩陣、所述位置嵌入矩陣和掩碼矩陣由所述三元組信息確定出,所述根據所述輸入信息,確定出多條包含所述三元組信息的文本數據,包括:
根據所述詞嵌入矩陣、所述關系類型嵌入矩陣、所述實體類型嵌入矩陣、所述位置嵌入矩陣和所述掩碼矩陣,確定出多條包含所述三元組信息的文本數據。
3.一種關系抽取數據生成模型,其特征在于,包括:
輸入單元,用于獲取由三元組信息確定出的輸入信息,其中,所述輸入信息包括詞嵌入、關系類型嵌入、實體類型嵌入、位置嵌入和掩碼;
文本數據確定單元,用于根據所述輸入信息,確定出多條包含所述三元組信息的文本數據;
輸出單元,用于輸出多條所述文本數據中的k條所述文本數據,其中,k為大于1的整數。
4.一種模型訓練方法,其特征在于,用于訓練如權利要求3所述的關系抽取數據生成模型,所述方法包括:
獲取結構化和/或半結構化的訓練數據,并確定出所述訓練數據中的三元組信息;
根據所述三元組信息確定出所述輸入信息;
將所述輸入信息輸入所述關系抽取數據生成模型,計算所述關系抽取數據生成模型輸出的文本數據與所述訓練數據的一致性,并更新所述關系抽取數據生成模型的參數;
利用所述訓練數據重復訓練所述關系抽取數據生成模型,直到達到訓練周期,保存訓練精度最好的關系抽取數據生成模型。
5.一種基于神經網絡的關系抽取數據生成方法,其特征在于,應用于電子設備,所述方法包括:
從種子知識圖譜中獲取待處理數據,并對所述待處理數據進行特征抽取,確定出三元組信息,其中,所述種子知識圖譜由結構化數據和/或半結構化數據構建;
根據所述三元組信息確定出輸入信息,其中,所述輸入信息包括詞嵌入、關系類型嵌入、實體類型嵌入、位置嵌入和掩碼;
將所述輸入信息輸入權利要求3所述的關系抽取數據生成模型,獲得k條所述文本數據。
6.根據權利要求5所述的基于神經網絡的關系抽取數據生成方法,其特征在于,對所述待處理數據進行特征抽取,確定出三元組信息,包括:
將所述待處理數據輸入預設的特征抽取模型中;
獲得所述特征抽取模型對所述待處理數據進行特征抽取后輸出的所述三元組信息。
7.根據權利要求5所述的基于神經網絡的關系抽取數據生成方法,其特征在于,確定出包含所述三元組信息的輸入信息,包括:
根據所述三元組信息中字表的大小,確定出詞嵌入矩陣;
根據所述三元組信息的主體、客體和關系,確定出關系類型嵌入矩陣;
根據所述三元組信息的實體類型的數量和關系類型的數量,確定出實體類型嵌入矩陣;
根據所述三元組信息中字表的位置,確定出位置嵌入矩陣;
根據所述三元組信息中三元組的長度,確定出掩碼矩陣;
根據所述詞嵌入矩陣、所述關系類型嵌入矩陣、所述實體類型嵌入矩陣、所述位置嵌入矩陣和所述掩碼矩陣,確定出所述輸入信息。
8.根據權利要求7所述的基于神經網絡的關系抽取數據生成方法,其特征在于,根據所述三元組信息的主體、客體和關系,確定出關系類型嵌入矩陣,包括:
根據所述三元組信息的主體、客體和關系,生成對應的關系類型序列;
將所述關系類型序列轉換為矩陣,以確定出所述關系類型嵌入矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910922416.1/1.html,轉載請聲明來源鉆瓜專利網。





