[發(fā)明專利]知識圖譜學習方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110339803.X | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN112905809A | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設計)人: | 張永祺;姚權銘 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/33;G06N20/00 |
| 代理公司: | 北京銘碩知識產(chǎn)權代理有限公司 11286 | 代理人: | 田方;曾世驍 |
| 地址: | 100085 北京市海淀區(qū)清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 學習方法 系統(tǒng) | ||
提供了一種知識圖譜學習方法和系統(tǒng),所述方法包括:構建針對知識圖譜嵌入模型的關系矩陣的搜索空間,其中,關系矩陣指示關系嵌入向量中的各個元素的矩陣分布,并且所述搜索空間包括多種關系矩陣;針對特定知識圖譜任務的使用關系矩陣的函數(shù),在所述搜索空間中搜索對應優(yōu)化關系矩陣候選的集合,并在所述優(yōu)化關系矩陣候選的集合中確定與所述函數(shù)對應的優(yōu)化關系矩陣;基于使用所述優(yōu)化關系矩陣的所述函數(shù)來訓練所述特定知識圖譜任務的嵌入模型;以及利用所述嵌入模型獲得所述特定知識圖譜任務的嵌入表示。
技術領域
本申請涉及人工智能領域中的知識圖譜嵌入技術,更具體地講,涉及一種知識圖譜學習方法和系統(tǒng)。
背景技術
隨著信息網(wǎng)絡技術的快速發(fā)展,各種信息網(wǎng)絡數(shù)據(jù)內容呈現(xiàn)爆炸式增長的態(tài)勢。這樣的內容通常具有大規(guī)模、異質多元、組織結構松散的特點,給人們有效獲取信息和知識提出了挑戰(zhàn)。知識圖譜(KG,Knowledge Graph)是語義網(wǎng)絡的知識庫,能夠用可視化技術描述知識資源及其載體,并挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯(lián)系。
知識圖譜作為一種特殊的圖形結構,實體(entity)作為結點,關系(relation)作為有向邊,最近引起了很多人的興趣。在知識圖譜中,每個邊緣可被表示為具有(頭部實體,關系,尾部實體)這一形式的三元組(h,r,t),以指示兩個實體h(即,頭部實體)和t(即,尾部實體)通過關系r連接,例如(NewYork,isLocatedIn,USA)可表示NewYork位于USA。在過去的幾十年中建立了許多大型知識圖譜,例如WordNet,F(xiàn)reebase,DBpedia,YAGO。它們改進了各種下游應用,例如結構化搜索、問答和實體推薦等。
在知識圖譜中,一個基本問題是如何量化給定三元組(h,r,t)的相似性,以便可以執(zhí)行后續(xù)應用。最近,知識圖譜嵌入(KGE,Knowledge Graph Embedding)已經(jīng)出現(xiàn)并發(fā)展成為用于此目的一種方法。知識圖譜嵌入旨在尋找低維度的實體和關系的向量表示(即,嵌入(embedding)),以便可以量化它們的相似性。具體說來,給定一組觀察到的事實(即,三元組),知識圖譜嵌入嘗試學習該三元組中的實體和關系的低維向量表示,以便可以量化三元組的相似性。可通過評分函數(shù)(Scoring Function)來測量這種相似度,評分函數(shù)可用于基于給定關系構建模型以用于衡量實體之間的相似性。要構建知識圖譜嵌入模型,最重要的是設計并選擇合適的評分函數(shù)。由于不同的評分函數(shù)在捕捉相似性方面有其自身的弱點和優(yōu)勢,因此評分函數(shù)的選擇對于知識圖譜嵌入的性能至關重要。
通常,評分函數(shù)是由人設計和選擇的,也是知識圖譜嵌入最重要的視角,它可以顯著影響嵌入的質量
為了生成高質量的嵌入,評分函數(shù)應該具有可擴展性和表現(xiàn)力。可擴展性意味著基于評分函數(shù)的知識圖譜嵌入模型的參數(shù)針對實體和關系的數(shù)量不應該增長得比線性更快,而表現(xiàn)力要求評分函數(shù)能夠處理知識圖譜中的常見的關系性質,即對稱、反對稱、一般不對稱和反向關系。
然而,由人類設計的新評分函數(shù)提升的性能逐漸變得微不足道。這主要是由于不同的知識圖譜在關系中有不同的模式,因此適應一個知識圖譜的評分函數(shù)可能不會在另一個知識圖譜上有一致的表現(xiàn)。此外,如何在眾多評分函數(shù)中為知識圖譜本身選擇最好的一個評分函數(shù)也已經(jīng)成為一個非常重要的問題。
發(fā)明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經(jīng)第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110339803.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





