[發明專利]神經網絡關系抽取方法、計算機設備及可讀存儲介質有效
| 申請號: | 202010752459.2 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN111898364B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 回艷菲;王健宗;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/295;G06F40/30;G06F16/35;G06F16/36;G06F18/25;G06N3/0464;G06N3/045;G06N3/0442;G06N3/08 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 王勇;鄧小玲 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 關系 抽取 方法 計算機 設備 可讀 存儲 介質 | ||
本發明公開了一種神經網絡關系抽取方法,包括:構建雙通道神經網絡模型;獲取待處理的句子;對所述句子進行依存句法分析,得到所述句子的兩個子句;將兩個子句輸入到第一通道中,通過CNN模型進行特征抽取,得到第一抽取信息;將所述句子輸入到第二通道中,通過LSTM模型進行特征抽取,得到第二抽取信息;通過注意力機制將所述第一抽取信息與所述第二抽取信息進行加權匯總得到所述語句最終的抽取特征,將所述最終的抽取特征輸入到softmax層以完成對所述目標實體之間的關系類別進行分類。本發明還提供一種計算機設備及計算機可讀存儲介質。本發明提供的神經網絡關系抽取方法,能夠高質量地進行關系抽取。
技術領域
本發明實施例涉及人工智能技術領域,特別涉及一種神經網絡關系抽取方法、計算機設備及可讀存儲介質。
背景技術
關系抽取在自然語言處理領域是一項非常重要的研究,作為一項重要的子任務,關系抽取旨在文本中抽取出兩個實體間預先定義好的語義關系,抽取的關系和實體之間可以組織成三元組的形式存入圖數據庫,基于相關的知識圖譜技術應用到醫療知識圖譜中。如何構造一個高質量的醫療知識圖譜,又離不開高質量的關系抽取。所以對于醫療知識圖譜,關系抽取的地位尤為重要。
傳統的關系抽取任務,一般通過單一的卷積神經網絡(Convolutional?NeuralNetwork,CNN)或者循環神經網絡(Recurrent?Neural?Network,RNN)等模型對句子進行向量化表示,但是單一模型的關系抽取質量并不高。
發明內容
本發明實施方式的目的在于提供一種神經網絡關系抽取方法,能夠高質量地進行關系抽取。
為解決上述技術問題,本發明的實施方式提供了一種神經網絡關系抽取方法,所述方法包括:構建雙通道神經網絡模型,所述雙通道神經網絡模型包括第一通道及第二通道;獲取待處理的句子;對所述句子進行依存句法分析,生成依存句法分析樹,從所述依存句法分析樹中找出目標實體間的兩條最短依存路徑,所述兩條最短路徑表示所述句子的兩個子句;將所述兩個子句輸入到所述第一通道中,通過卷積神經網絡模型進行特征抽取,得到第一抽取信息;將所述句子輸入到所述第二通道中,通過長短期記憶網絡模型進行特征抽取,得到第二抽取信息;通過注意力機制將所述第一抽取信息與所述第二抽取信息進行加權匯總得到所述句子最終的抽取特征,將所述最終的抽取特征輸入到softmax層以完成對所述目標實體之間的關系類別進行分類。
優選地,還包括:對構建的所述雙通道神經網絡模型進行訓練。
優選地,所述對構建的所述雙通道神經網絡模型進行訓練,包括:獲取訓練集;將所述訓練集輸入到所述雙通道神經網絡模型以輸出所述訓練集的預測關系類別;依據所述雙通道神經網絡模型輸出的預測關系類別與所述訓練集的實際關系類別,計算損失函數交叉熵;通過優化算法對所述損失函數進行最小化,以訓練所述雙通道神經網絡模型。
優選地,將所述兩個子句輸入到所述第一通道中,通過卷積神經網絡模型進行特征抽取,得到第一抽取信息,包括:將所述兩個子句的詞語進行向量表示;將所述兩個子句的向量表示通過卷積層、池化層和非線性層進行處理;將處理后的兩個子句的向量表示通過隱層進行融合,得到第一抽取信息。
優選地,所述將所述句子輸入到所述第二通道中,通過長短期記憶網絡模型進行特征抽取,得到第二抽取信息,包括:對所述句子進行分詞操作以獲取L個分詞;對所述L個分詞分別進行詞向量映射,以獲取L*d維詞向量矩陣,所述L個分詞映射為一個d維詞向量;將所述L個分詞的d維詞向量依順序輸入到所述長短期記憶網絡模型中進行特征抽取,得到所述第二抽取信息。
優選地,所述對所述句子進行依存句法分析,得到所述句子的兩個子句,包括:通過句法分析器對所述句子進行依存句法分析,生成依存句法分析樹;從所述依存句法分析樹中找出目標實體間的兩條最短依存路徑,所述兩條最短路徑表示所述句子的兩個子句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010752459.2/2.html,轉載請聲明來源鉆瓜專利網。





