[發明專利]一種低噪聲干擾的有監督關系抽取方法及裝置在審
| 申請號: | 202110985570.0 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113849637A | 公開(公告)日: | 2021-12-28 |
| 發明(設計)人: | 于洪濤;胡新棒;李邵梅;張建朋;李繼中;黃瑞陽;高超 | 申請(專利權)人: | 中國人民解放軍戰略支援部隊信息工程大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 鄭州大通專利商標代理有限公司 41111 | 代理人: | 張立強 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 噪聲 干擾 監督 關系 抽取 方法 裝置 | ||
1.一種低噪聲干擾的有監督關系抽取方法,其特征在于,包括:
步驟1:將待處理的語料轉換為向量化的形式,得到編碼序列;
步驟2:將所述編碼序列送入MogrifierBiGRU-GateAttention-softmax中的第二層MogrifierBiGRU,得到融入上下文信息的編碼序列;
步驟3:將所述融入上下文信息的編碼序列送入MogrifierBiGRU-GateAttention-softmax中的第三層GateAttention,剔除任務無關信息,并聚合篩選結果,得到句向量;
步驟4:將所述句向量送入softmax,得到關系抽取結果。
2.根據權利要求1所述的一種低噪聲干擾的有監督關系抽取方法,其特征在于,步驟1具體為:使用詞向量表對長度為n、頭尾實體長度均為1、分別位于時刻i、j的輸入文本進行編碼,得到編碼序列其中,xk為位于時刻k的嵌入維度為dx的預訓練詞向量,且k∈(1,2,…,n);分別為頭尾實體起止指示符對應的詞向量,維度為dx。
3.根據權利要求1所述的一種低噪聲干擾的有監督關系抽取方法,其特征在于,所述步驟2具體包括:
步驟2.1:根據當前時刻t的輸入xt、上一時刻隱狀態ht-1,按照公式(1)至公式(8)計算當前時刻t的隱狀態ht:
xt′=2σ(Qht-1)⊙xt (1)
ht-1′=2σ(Rxt′)⊙ht-1 (2)
xt″=2σ(Qht-1′)xt′ (3)
ht-1″=2σ(Rxt″)ht-1′ (4)
zt=σ(Wzxt″+Uzht-1″+bz) (5)
rt=σ(Wrxt″+Urht-1″+br) (6)
其中,⊙為矩陣點乘,σ為sigmoid函數,tanh為激活函數,Q、R、Wz、Wr、Wh、Uz、Ur、Uh為權重矩陣,bz、br、bh為偏置,xt′、ht-1′、xt″、ht-1″為中間狀態,zt為更新門,rt為重置門,為當前記憶內容;
步驟2.2:按照公式(9)將正向、反向的隱狀態進行拼接得到當前時刻t在上下文語境中的編碼進而得到整個文本的上下文編碼
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍戰略支援部隊信息工程大學,未經中國人民解放軍戰略支援部隊信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110985570.0/1.html,轉載請聲明來源鉆瓜專利網。





