[發(fā)明專利]數(shù)據(jù)驗證方法和裝置、電子設備、計算機可讀介質(zhì)在審
| 申請?zhí)枺?/td> | 202110446545.5 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN113127648A | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設計)人: | 余金星;蔡云峰;孫明明;李平 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N5/02 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù) 驗證 方法 裝置 電子設備 計算機 可讀 介質(zhì) | ||
1.一種數(shù)據(jù)驗證方法,所述方法包括:
將知識圖譜的三元組轉(zhuǎn)換到矩陣空間,得到與所述三元組的實體對應的實體矩陣,和與所述三元組的實體間的關系對應的兩個關系矩陣;
基于所述實體矩陣、所述兩個關系矩陣,得到所述三元組的距離值;
基于所述距離值,驗證所述三元組,得到驗證結果。
2.根據(jù)權利要求1所述的方法,其中,所述實體矩陣包括:分別與頭實體和尾實體對應的頭矩陣和尾矩陣,所述基于所述實體矩陣、所述兩個關系矩陣,得到所述三元組的距離值,包括:
分別將所述頭矩陣、所述尾矩陣、所述兩個關系矩陣代入距離評分函數(shù),計算得到所述三元組的距離值。
3.根據(jù)權利要求2所述的方法,其中,所述距離評分函數(shù)采用下式表示:
||F表示矩陣的F范數(shù),H表示頭矩陣,T表示尾矩陣,R、R’表示兩個關系矩陣,h表示頭實體,t表示尾實體,r表示頭實體與尾實體之間的關系,f(h,r,t)表示三元組的距離值。
4.根據(jù)權利要求3所述的方法,所述方法應用于已訓練的評分模型,所述評分模型的輸入為所述知識圖譜的三元組,所述評分模型的輸出為所述知識圖譜的三元組的真假概率值,在所述矩陣空間中各個矩陣的參數(shù)隨機初始化之后,采用以下訓練步驟訓練得到所述評分模型:
選取所述知識圖譜的預設數(shù)量的三元組作為正樣本輸入預設的網(wǎng)絡,對所述正樣本進行隨機采樣得到該三元組的負樣本;
基于所述正樣本、所述負樣本計算所述網(wǎng)絡的損失函數(shù),更新各個實體矩陣的參數(shù)、各個關系矩陣的參數(shù);
響應于所述網(wǎng)絡滿足訓練完成條件,則將所述網(wǎng)絡作為已訓練的評分模型。
5.根據(jù)權利要求4所述的方法,其中,所述損失函數(shù)包括:
其中,γ為超參數(shù),σ(x)表示sigmoid激活函數(shù);k是負樣本的個數(shù);(h′i,r,t′i)表示第i個采樣的負樣本,(h′i,r,t′i)通過將三元組(h,r,t)的頭實體或尾實體隨機替換得到;p(h′i,r,t′i)表示負樣本的權重,p(h′i,r,t′i)采用softmax函數(shù)。
6.根據(jù)權利要求4所述的方法,其中,所述損失函數(shù)包括:L=L1+λLreg;其中,λ為正則項系數(shù),是超參數(shù);
γ為超參數(shù),σ(x)表示sigmoid激活函數(shù);k是負樣本的個數(shù);(h′i,r,t′i)表示第i個采樣的負樣本,(h′i,r,t′i)通過將三元組(h,r,t)的頭實體或尾實體隨機替換得到;p(h′i,r,t′i)表示負樣本的權重,p(h′i,r,t′i)采用softmax函數(shù);
Lreg=|W2-W|F+|W′2-W′|F;
W=RTR,W′=R′TR′。
7.根據(jù)權利要求1-3之一所述的方法,其中,所述將知識圖譜的三元組轉(zhuǎn)換到矩陣空間,得到與所述三元組的實體對應的實體矩陣,和與所述三元組的實體間的關系對應的兩個關系矩陣,包括:
將所述知識圖譜的三元組輸入已訓練完成的知識圖譜嵌入模型,得到所述知識圖譜嵌入模型輸出的與所述三元組的實體對應的實體矩陣,和與所述三元組的實體間的關系對應的兩個關系矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110446545.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





