[發(fā)明專利]知識圖譜關系抽取方法、裝置、電子設備及存儲介質在審
| 申請?zhí)枺?/td> | 202011423929.7 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112560490A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設計)人: | 余爾鑫;田原;常毅 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/211;G06N3/04 |
| 代理公司: | 北京恒博知識產(chǎn)權代理有限公司 11528 | 代理人: | 張曉芳 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 關系 抽取 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種知識圖譜關系抽取方法、裝置、電子設備及存儲介質,其中,該方法包括:通過獲取至少一個句子集合;其中,句子集合包括多個相同實體的句子;將至少一個句子集合輸入句子層次化模型輸出至少一個句子集合中每個句子的最終表示;基于至少一個句子集合中每個句子的最終表示與動態(tài)注意力機制結合,獲得至少一個句子集合的關系分類策略。由此,本申請通過將句子層次化模型得到的每個句子的最終表示與動態(tài)注意力機制結合得到句子集合的關系分類策略,來調整句子集合在不同關系層次的表示,不僅避免了現(xiàn)有技術中需要訓練大量的關系分類器,還解決了遠程監(jiān)督帶來噪聲問題和長尾關系問題。
技術領域
本申請涉及信息技術領域,具體涉及一種知識圖譜關系抽取方法、裝置、電子設備及存儲介質。
背景技術
知識圖譜(knowledge bases)為真實世界的事實提供了有效的結構化信息,被很多自然語言處理(NLP)任務,比如,網(wǎng)頁搜索和知識問答用作關鍵資源,用作關鍵資源。由于真實世界中的事實可以說是無窮無盡的,并且每天都在不斷增長,因此,現(xiàn)階段的知識圖譜處于快速增長模式。
在實現(xiàn)本公開的過程中,發(fā)明人發(fā)現(xiàn):對于知識圖譜中的某些句子,當其僅包含了兩個實體,但語義上并沒有表示出它們之間的特定關系,這樣的句子也被當作訓練的實例的話,就會產(chǎn)生錯誤的標簽,即噪聲數(shù)據(jù),對知識圖譜模型有著負面的影響。因此,如何解決日漸增多的信息給知識圖譜帶來的噪聲問題是一個亟待解決的技術問題。
發(fā)明內容
本申請實施例提供了一種知識圖譜關系抽取方法、裝置、電子設備及存儲介質。
第一方面,本申請實施例提供了一種知識圖譜關系抽取方法,所述方法包括:
獲取至少一個句子集合;其中,所述句子集合包括多個相同實體的句子;
將所述至少一個句子集合輸入句子層次化模型輸出所述至少一個句子集合中每個句子的最終表示;
將所述至少一個句子集合中每個句子的最終表示與動態(tài)注意力機制結合,獲得所述至少一個句子集合的關系分類策略;其中,所述動態(tài)注意力機制用于表示所述每個句子的層次表示在對應的句子集合中的權重。
第二方面,本申請實施例提供了一種知識圖譜關系抽取裝置,所述裝置包括:
獲取模塊,用于獲取至少一個句子集合;其中,所述句子集合包括多個相同實體的句子;
模型模塊,用于將所述至少一個句子集合輸入句子層次化模型輸出所述至少一個句子集合中每個句子的最終表示;
獲得模塊,用于將所述至少一個句子集合中每個句子的最終表示與動態(tài)注意力機制結合,獲得所述至少一個句子集合的關系分類策略;其中,所述動態(tài)注意力機制用于表示所述每個句子的層次表示在對應的句子集合中的權重。
第三方面,本申請實施例提供了一種電子設備,包括:處理器和存儲器;其中,所述存儲器存儲有計算機程序,所述計算機程序適于由處理器加載并執(zhí)行本申請實施例第二方面提供的方法步驟。
第四方面,本申請實施例提供了一種電子設備,包括:處理器和存儲器;其中,所述存儲器存儲有計算機程序,所述計算機程序適于由處理器加載并執(zhí)行本申請實施例第三方面提供的方法步驟。
本申請一些實施例提供的技術方案帶來的有益效果至少包括:
在本申請實施例中,通過獲取至少一個句子集合;其中,句子集合包括多個相同實體的句子;將至少一個句子集合輸入句子層次化模型輸出至少一個句子集合中每個句子的最終表示;基于至少一個句子集合中每個句子的最終表示與動態(tài)注意力機制結合,獲得至少一個句子集合的關系分類策略。由此,本申請通過將句子層次化模型得到的每個句子的最終表示與動態(tài)注意力機制結合得到句子集合的關系分類策略,來調整句子集合在不同關系層次的表示,不僅避免了現(xiàn)有技術中需要訓練大量的關系分類器,還解決了遠程監(jiān)督帶來噪聲問題和長尾關系問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經(jīng)吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011423929.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





