[發明專利]基于因果干預的知識表示學習模型置信度測量方法在審
| 申請號: | 202110952561.1 | 申請日: | 2021-08-19 |
| 公開(公告)號: | CN113656597A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 劉宇;王愷;單世民;趙哲煥;徐秀娟 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/31;G06N5/04;G06N20/00 |
| 代理公司: | 遼寧鴻文知識產權代理有限公司 21102 | 代理人: | 楊植 |
| 地址: | 116024*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 因果 干預 知識 表示 學習 模型 置信 測量方法 | ||
1.一種基于因果干預的知識表示學習模型置信度測量方法,其特征在于,包括如下步驟:
(1)構造鄰域干預向量集
給定預測三元組查詢集和訓練得到的知識表示模型,首先對每個預測三元組的已知實體,構造鄰域干預向量集;通過讀取知識表示模型的訓練參數矩陣,可以得到已知實體的分布式表示向量;通過對實體參數矩陣的數值統計,得到實體干預數值;給定已知實體向量和實體干預數值,通過依次用干預數值替換已知實體向量每個維度的數值,構造出多個互不相同的鄰域干預向量;這些向量共同構成該預測三元組的鄰域干預向量集;
(2)生成鄰域干預序列
首先以已知實體向量和實體集全集作為輸入,執行知識表示模型的預測算法,得到候選三元組的得分序列;通過提取得分序列中的前K項,得到K個候選實體和他們的得分;進而將每個鄰域干預向量和K個候選實體作為輸入,執行知識表示模型的預測算法,得到每個維度干預后的模型預測結果;這些干預后輸出的得分序列,用于下一步計算置信度分數;
(3)計算序列一致性得分;
給定K個候選實體的原始得分序列和干預后的得分序列,計算兩個得分序列的一致性;對每個候選實體,若其在兩個得分序列中的排名相同,則計為陽性;否則,計為陰性;進而對所有陽性實體的歸一化得分進行求和,得到該干預序列的一致性得分;最后,將多個維度的一致性得分求平均數,得到對該預測三元組的最終置信度得分。
2.根據權利要求1所述的一種基于因果干預的知識表示學習模型置信度測量方法,其特征還在于,
第一步:鄰域干預;首先對輸入的實體向量e∈Rd,依次修改每個維度的向量數值,得到d個不同的鄰域向量Ne∈Rd×d,即:
Ne=(1-Id)×e+Id×v(e)
其中Id∈Rd×d是單位矩陣,v(e)指的是干預值用以替換向量中的原始數值,可以選擇實體向量中的最大值或最小值;
第二步:序列生成;首先向訓練好的知識表示學習模型輸入原始實體向量,得到原始得分序列;從該序列中提取前K個得分最高的實體,作為候選實體集;然后依次將每個鄰域向量輸入到模型中,得到對K個候選實體的多次得分序列預測結果;將每個得分序列處理為對應的實體排名索引從而得到d個排名索引序列;
第三步:計算一致度;首先定義單次干預的一致性得分該得分基于兩個排名序列的差異,兩個序列越接近,則一致性得分越高,也代表干預后的結果更為穩定;具體的一致性得分定義如下:
其中,σ(·)和Sgn(·)分別代表Softmax函數和Sign函數;當一致性得分時,說明兩個排名序列在前J個位置上有相同的候選實體;否則,越靠前位置的不匹配都會造成一致性的減??;在計算每個干預向量對應的一致性得分后,最終的置信度得分是這些得分的平均值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110952561.1/1.html,轉載請聲明來源鉆瓜專利網。





