[發明專利]多元關系知識庫構建方法和系統在審
| 申請號: | 202011019535.5 | 申請日: | 2020-09-24 |
| 公開(公告)號: | CN114328940A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 姚權銘 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F17/16;G06K9/62 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 田方;蘇銀虹 |
| 地址: | 100085 北京市海淀區清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多元 關系 知識庫 構建 方法 系統 | ||
1.一種多元關系知識庫構建方法,所述方法包括:
針對多元關系知識庫中的多元組構建多元關系模型,并建立對應估分函數和損失函數,其中,所述多元關系知識庫中的每個多元組由一個關系和多個實體構成,所述一個關系與所述多個實體中的每個實體之間的對應語義由角色來指示,并且所述一個關系的各個角色與所述多個實體中的對應實體之間的對應觀測事實構成與該多元組對應的觀測事實集合,其中,所述估分函數用于指示與每個多元組對應的觀測事實集合中的角色與實體之間的關聯性;
基于所述估分函數和損失函數,使用從所述多元關系知識庫獲得的訓練樣本對所述多元關系模型進行訓練,其中,訓練樣本是與所述多元關系知識庫中的不具有缺失實體的多元組對應的觀測事實集合;
基于經過訓練的多元關系模型來預測并補全所述多元關系知識庫中具有缺失實體的多元組中的缺失實體,并基于補全了缺失實體的各個多元組來構建完整的多元關系知識庫。
2.如權利要求1所述的方法,其中,建立估分函數的步驟包括:
建立包括預定數量的潛在角色基本向量的潛在角色空間,并基于所述潛在角色基本向量來確定每個角色的角色嵌入向量;
將每個實體映射到針對語義的預定數量的語義嵌入向量;
確定每個角色的角色敏感模式矩陣,其中,角色敏感模式矩陣指示該角色與各個實體的語義嵌入向量之間的交互強度;
基于角色嵌入向量、語義嵌入向量以及角色敏感模式矩陣來建立所述估分函數,
其中,每個角色的角色嵌入向量由所述潛在角色基本向量的組合來表示,并且
其中,每個角色的角色敏感模式矩陣是基于與所述潛在角色基本向量關聯的基本矩陣建立的。
3.如權利要求2所述的方法,其中,所述估分函數被表示為:
其中,
且k′=1,2,...,K,
其中,
表示所述多元關系知識庫中的元數為(ar+1)的多元組,r指示該多元組中的關系且r∈關系域ei指示該多元組中的第i個實體且ei∈實體域ε,是關系r的角色的集合,是與該多元組對應的觀測事實集合,ar≥2且ar是正整數,
是關系r的第i個角色的嵌入向量,是角色的嵌入向量的對應角色權重矢量,指示由實體ei的m個語義嵌入向量構成的矩陣,是角色的角色敏感模式矩陣并且其第j行指示與所述多元組中的第j個實體ej的m個語義嵌入向量的交互強度,是潛在角色空間中的第k個潛在角色基本向量并且是與所述第k個潛在角色基本向量關聯的基本矩陣,Φ是利用溫度參數進行歸一化的函數并且Tu是針對角色權重矢量的溫度參數且TP是針對角色敏感模式矩陣的溫度參數,
其中,d指示角色的嵌入向量維度,K是預設的潛在角色空間的大小并且指示潛在角色基本向量的數量,并且m是預定值。
4.如權利要求3所述的方法,其中,所述損失函數表示為:
其中,
表示針對正樣本構建的ar組負樣本的集合,φ是所述估分函數,表示實體域ε中與所述正樣本中的實體ei不同的另一實體,表示替換正樣本中的第q個實體所獲得的負樣本集合,1≤q≤ar且q為正整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011019535.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種服裝、膚色、發色比色卡
- 下一篇:一種沙棘汁及其制備方法





