[發明專利]一種基于圓周卷積的知識圖譜補全方法在審
| 申請號: | 202011041999.6 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112131406A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 侯杰;李俊;李鵬華;朱智勤;趙芬;蘇豪;劉家尉 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400065 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圓周 卷積 知識 圖譜 方法 | ||
本發明涉及一種基于圓周卷積的知識圖譜補全方法,屬于自然語言處理領域。該方法包括:S1:對于三元組(ei,rk,ej)隨機初始化得到它們對應的向量S2:把三元組按照設定比例分為合理三元組和擾亂三元組;S3:把關系向量通過一個全連接層處理并重構得到卷積核Wg;S4:利用圓周填充方法,對實體向量進行填充得到向量S5:卷積核Wg對處理后的實體向量進行卷積運算得到特征圖M;S6:對特征圖M進行處理后點積實體向量得到分數pi;S7:計算損失函數。本發明簡化了實體和關系之間的交互,大大提升了預測效果。
技術領域
本發明屬于自然語言處理領域,涉及基于圓周卷積的知識圖譜補全方法。
背景技術
隨著信息技術與互聯網技術的高速發展,網絡上各行各業的信息越來越多,我們逐漸進入一個信息化,智能化的時代。海量新的數據和信息每天都以不同的形式產生,由于這些內容具有大規模、多元化、組織結構松散等特點,如何從海量數據中獲取有效信息已成為眾多領域面臨的主要難題。為此,許多公司開始構建自己的知識圖譜,知識圖譜實際上是一個以三元組(ei,rk,ej)形式結構的大型事實結構數據庫,其中ei和ej表示主實體和對象實體,rk表示它們之間的關系,當前大型的知識圖譜主要有Yago、Freebase、Google KG等。知識圖譜可以廣泛的用在搜索引擎、對話生成、問答系統等方面,也有許多優勢,例如在搜索引擎方面引入了知識圖譜,能夠更好地從語義關系上了解用戶的搜索意圖,這一改進優化了以往的搜索方式,提高了搜索質量。但是知識圖譜也存在一些問題,目前面臨的最大問題即是知識圖譜的不完整性,例如在Freebase中超過66%的人物實體沒有出生地。為了解決這一重大難題,許多知識圖譜補全的方法被提出,知識圖譜補全目的是讓知識圖譜中的實體和關系表示為稠密低維實值向量,使得知識圖譜中的實體和關系在低維空間中具有語義聯系,讓知識圖譜推理出其中所隱含的關系或實體。目前主要有兩種方法,一種是基于翻譯模型(translationalmodels)的方法,另一種是基于卷積神經網絡模型(convolutionalneural network based models)的方法。但是基于翻譯模型的方法在知識圖譜補全中效果較差,而且無法解決一對多或者多對一的問題,基于卷積神經網絡模型的方法在一維實體和一維關系提取信息時并不直觀。
發明內容
有鑒于此,本發明的目的在于提供一種基于圓周卷積的知識圖譜補全方法,通過關系生成每個三元組特定的卷積層卷積核,并將這些過濾器應用到主實體嵌入中,從而簡化實體和關系之間的交互,同時大大提升預測效果。
為達到上述目的,本發明提供如下技術方案:
一種基于圓周卷積的知識圖譜補全方法,具體包括以下步驟:
S1:對于三元組(ei,rk,ej)隨機初始化得到它們對應的向量
S2:把三元組按照設定比例分為合理三元組和擾亂三元組;
S3:把關系向量通過一個全連接層處理并重構得到卷積核Wg;
S4:利用圓周填充方法,對實體向量進行填充得到向量
S5:卷積核Wg對處理后的實體向量進行卷積運算得到特征圖M;
S6:對特征圖M進行處理后點積實體向量得到一個分數pi;
S7:把得到的分數pi進行損失函數計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011041999.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于互聯網的各種名單多維度展示方法
- 下一篇:測試環境的切換方法及裝置





