[發明專利]一種基于改進的嵌入模型SUKE的不確定知識圖預測方法有效
| 申請號: | 202011159784.4 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112348190B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 汪璟玢;聶寬 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 錢莉;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 嵌入 模型 suke 不確定 知識 預測 方法 | ||
本發明涉及一種基于改進的嵌入模型SUKE的不確定知識圖預測方法。基于已有的確定性嵌入模型DistMult提出SUKE模型。SUKE保留了知識的結構信息和不確定性信息,其內部包括評估器和置信度生成器兩個組件,前者依據事實的結構特征和不確定特征評估事實的合理性,篩選出不合理的事實,從而獲得候選事實。后者為候選事實生成置信度,表示實體發生特定關系的概率。評估器為每個三元組定義結構得分和不確定得分,用于事實合理性評估任務。此外,評估器引入了未知事實參與訓練。置信度生成器為每個三元組生成置信度,用于置信度預測任務。本發明能夠有效的完成不確定知識圖的鏈路預測任務。
技術領域
本發明涉及知識圖譜下的知識表示與推理技術領域,特別是一種基于改進的嵌入模型SUKE的不確定知識圖預測方法。
背景技術
不確定知識圖譜會為每個三元組提供置信度分數,置信度反映了三元組的發生的概率。近年來,關系提取和眾包的發展推動了大規模不確定性知識圖譜的構建,如:ConceptNet、Probase和NELL等。hu等人2017年提出URGE。URGE提出了一種基于矩陣分解的方法來嵌入不確定的網絡。但該模型僅考慮了稀疏網絡中的節點鄰近度,并且僅學習節點嵌入。Chen等人在2019年提出的UKGE,其利用三元組的置信度學習嵌入,同時引入了概率軟邏輯推斷看不見的事實。但UKGE只使用置信度信息學習嵌入,忽略了三元組的結構信息。
目前,針對不確定性的知識圖譜的嵌入研究甚少。Miao等人在2015年首次提出了知識圖譜的不確定性推理模型IIKE。雖然IIKE取得了不錯的性能,但其在計算三元組的置信度概率得分時只孤立地考慮每個三元組,沒有利用知識圖譜是相互關聯的特性。在不確定性知識圖嵌入工作中,表現比較突出的模型有hu等人在2018年提出的URGE和chen等人在2019年提出的UKGE。URGE模型針對不確定網絡設計,考慮了節點的鄰近度生成節點嵌入,雖然URGE模型可以推廣到知識圖譜上,但不確定網絡與知識圖譜存在著差異,其并不能很好的完成不確定知識圖的嵌入任務。UKGE相比于URGE,性能更加優秀,但UKGE模型在一定程度上沒有充分利用知識的結構信息。
發明內容
有鑒于此,本發明的目的是提供一種基于嵌入模型SUKE的不確定知識圖預測方法,能夠有效的完成不確定知識圖的鏈路預測任務。
本發明采用以下方案實現:一種基于嵌入模型SUKE的不確定知識圖預測方法,包括以下步驟:
步驟S1:給定不確定知識圖,其內部包含著多個四元組(h,r,t,w),其中h代表頭實體,t代表尾實體,r代表頭尾實體的關系,w代表三元組(h,r,t)發生關系的概率;通過UKGE模型中定義的概率軟邏輯推理方法擴充原始四元組的數量;最后將擴充好的四元組劃分為訓練集60%、驗證集20%和測試集20%用于訓練SUKE模型;SUKE的模型的輸入是h,r,t的向量表示,使用TransE算法對知識庫中實體和關系的向量進行預訓練或者隨機初始化;
步驟S2:構建嵌入模型SUKE:設計了評估器和置信度生成器兩個組件,其中,評估器用于評估三元組(h,r,t)的合理性,通過評估器將去除不合理的三元組并且將合理的三元組作為候選集合,置信度生成器用于為候選集合生成置信度從而得到四元組(h,r,t,w);通過損失函數訓練評估器和置信度生成器,用于后續的預測;
步驟S3:將獲得的四元組(h,r,t,w),加入到原始不確定知識圖譜;其中鏈路預測定義為給定一個不完備四元組(h,r,?,?)預測其缺失的尾實體和置信度;將鏈路預測獲得的新四元組加入原始不確定知識圖譜用以使知識圖譜更完備;其中,在預測時,對于一個缺失尾實體的三元組(h,r,?),使用知識圖中的實體集合填充尾實體得到待評估三元組集合。
進一步地,所述步驟S2具體包括以下步驟:
步驟S21:通過DistMult模型計算三元組能量得分,通過訓練分別獲得能量得分到結構得分和不確定得分的映射函數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011159784.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種定位銷銷套安裝結構
- 下一篇:一種肺癌患者的治療預后評估模型





