[發明專利]知識嵌入方法在審
| 申請號: | 202210974217.7 | 申請日: | 2022-08-15 |
| 公開(公告)號: | CN115391606A | 公開(公告)日: | 2022-11-25 |
| 發明(設計)人: | 王雅琳;彭渝彬;郭靜宇;隋慶開;周澤雄;林邠;李淑賢;袁小鋒;王凱 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/906;G06F40/30;G06V10/774 |
| 代理公司: | 長沙軒榮專利代理有限公司 43235 | 代理人: | 姚興 |
| 地址: | 410000 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 嵌入 方法 | ||
本申請適用于知識圖譜技術領域,提供了一種知識嵌入方法,該方法包括:分別針對知識圖譜中的每一三元組執行如下步驟:提取三元組中實體間的聚類特征和層次特征,并利用三元組中(h,c,t)的出現頻次和(h,t)的出現頻次,對聚類特征和層次特征進行頻次增強處理,得到頻次增強后的聚類特征和層次特征;將聚類特征、層次特征、頻次增強后的聚類特征和層次特征均轉換為三元組的評分值,并對三元組的所有評分值進行加權求和,得到頻次增強融合模型;對頻次增強融合模型進行訓練,并將訓練后的頻次增強融合模型中的實體和關系的嵌入向量組作為知識圖譜的知識表示嵌入結果。本申請能提升知識圖譜的鏈接預測準確率。
技術領域
本申請屬于知識圖譜技術領域,尤其涉及一種知識嵌入方法。
背景技術
2012年谷歌公司正式提出知識圖譜的概念,并成功應用于搜索領域,至此之后知識圖譜開始被廣泛地關注,逐漸成為人工智能領域重要的研究內容,目前在數據挖掘、問答系統等領域有了廣泛應用。而知識圖譜在各個領域的應用中都包含不可或缺的一步:知識嵌入,即如何將知識轉換成數學形式表達,以便于后續任務的推進,因此如何進行有效的知識嵌入是知識圖譜應用的關鍵。
傳統的知識嵌入方法主要是基于獨熱表示,通過為每一個實體和關系分配獨熱編碼向量,同時設計相應的算法計算實體間的聯系從而能夠進行推理操作。但是采用獨熱編碼不僅有數據稀疏的問題,而且在大規模知識圖譜上,其對內存需求也是巨大的。
后續的知識表示學習,旨在將實體和關系嵌入到低維向量空間中,該方式不僅極大的節省空間,且數據間的聯系可通過向量空間的部分特性(如距離等) 來反應,解決了傳統獨熱編碼的數據稀疏問題。
典型的知識圖譜表示學習方法包括以transE為代表的平移模型以及以 rotateE為代表的旋轉模型,其中平移模型將關系看作實體間的翻譯操作,主要通過向量的加法操作,對頭實體進行平移,使得頭實體與尾實體間的距離縮小;旋轉模型將關系表示成旋轉量,即頭實體通過關系進行旋轉后,與尾實體間的距離縮小。平移模型側重于提取知識圖譜三元組中實體的聚類特征,旋轉模型側重于提取實體的層次特征。
在大多數知識圖譜中聚類和層次兩種特征同時存在,但目前在基于聚類特征或者層次特征完成知識嵌入時,知識圖譜的鏈接預測準確率低。
發明內容
本申請實施例提供了一種知識嵌入方法,可以解決知識圖譜的鏈接預測準確率低的問題。
本申請實施例提供了一種知識嵌入方法,包括:
分別針對知識圖譜中的每一三元組(h,c,t),提取三元組(h,c,t)中實體間的聚類特征和層次特征,并利用三元組(h,c,t)中(h,c,t)的出現頻次和(h,t)的出現頻次,對聚類特征和層次特征進行頻次增強處理,得到頻次增強后的聚類特征和層次特征;其中,h表示三元組中的頭實體,t表示三元組中的尾實體, c表示三元組中的關系;
分別針對每一三元組(h,c,t),將三元組(h,c,t)對應的聚類特征、層次特征、頻次增強后的聚類特征和層次特征均轉換為三元組(h,c,t)的評分值,并對三元組(h,c,t)的所有評分值進行加權求和,得到頻次增強融合模型;
分別針對每一三元組(h,c,t),對三元組(h,c,t)對應的頻次增強融合模型進行訓練,并將訓練后的頻次增強融合模型中的實體和關系的嵌入向量組作為知識圖譜的知識表示嵌入結果;
實體的嵌入向量組包括實體的聚類特征向量、層次特征向量和頻次特征向量,關系的嵌入向量組包括關系的聚類特征向量、關系門控向量、層次特征向量和頻次特征向量。
可選的,提取三元組(h,c,t)中實體間的聚類特征,包括:
獲取三元組對應的頭實體h的聚類特征向量三元組對應的尾實體t的聚類特征向量以及三元組對應的關系c的聚類特征向量和關系門控向量
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210974217.7/2.html,轉載請聲明來源鉆瓜專利網。





