[發明專利]數據驗證方法和裝置、電子設備、計算機可讀介質在審
| 申請號: | 202110446545.5 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN113127648A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 余金星;蔡云峰;孫明明;李平 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N5/02 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 驗證 方法 裝置 電子設備 計算機 可讀 介質 | ||
本公開提供了一種數據驗證方法和裝置,涉及知識圖譜、深度學習等技術領域。具體實現方案為:將知識圖譜的三元組轉換到矩陣空間,得到與三元組的實體對應的實體矩陣,和與三元組的實體間的關系對應的兩個關系矩陣;基于實體矩陣、兩個關系矩陣,得到三元組的距離值;基于距離值,驗證三元組,得到驗證結果。該實施方式提高了知識圖譜的數據驗證的準確率。
技術領域
本公開涉及計算機技術領域,具體涉及知識圖譜、深度學習等技術領域,尤其涉及一種數據驗證方法和裝置、電子設備、計算機可讀介質以及計算機程序產品。
背景技術
知識圖譜的初始化自動構建和持續不斷地收錄知識三元組的過程通常會使用各種信息抽取的算法來實現,鑒于知識圖譜的廣泛應用,知識圖譜中的三元組數據的準確性至關重要。
為了保證知識圖譜收錄的三元組的準確性,通常使用人工手動地校驗三元組事實的真假。然而,由于知識圖譜三元組體量巨大,且每天需要收錄大量的新的知識三元組,若每個三元組都用人工校驗,需要大量的人力,人力投入較高。
發明內容
提供了一種數據驗證方法和裝置、電子設備、計算機可讀介質以及計算機程序產品。
根據第一方面,提供了一種數據驗證方法,上述方法包括:將知識圖譜的三元組轉換到矩陣空間,得到與三元組的實體對應的實體矩陣,和與三元組的實體間的關系對應的兩個關系矩陣;基于實體矩陣、兩個關系矩陣,得到三元組的距離值;基于距離值,驗證三元組,得到驗證結果。
根據第二方面,提供了一種數據驗證裝置,該裝置包括:轉換單元,被配置成將知識圖譜的三元組轉換到矩陣空間,得到與三元組的實體對應的實體矩陣,和與三元組的實體間的關系對應的兩個關系矩陣;計算單元,被配置成基于實體矩陣、兩個關系矩陣,得到三元組的距離值;驗證單元,被配置成基于距離值,驗證三元組,得到驗證結果。
根據第三方面,提供了一種電子設備,該電子設備包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器,其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行如第一方面任一實現方式描述的方法。
根據第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行如第一方面任一實現方式描述的方法。
根據第五方面,提供了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如第一方面任一實現方式描述的方法。
本公開的實施例提供的數據驗證方法和裝置,首先,將知識圖譜的三元組轉換到矩陣空間,得到與三元組的實體對應的實體矩陣,和與三元組的實體間的關系對應的兩個關系矩陣;其次,基于實體矩陣、兩個關系矩陣,得到三元組的距離值;最后,基于距離值,驗證三元組,得到驗證結果。由此,針對知識圖譜的數據驗證,本公開提供的數據驗證方法,采用兩個關系矩陣表示實體間的關系,使得數據驗證方法可以很好地建模知識圖譜中一對多,多對一,多對多等實體之間的關系,提高了知識圖譜數據驗證的準確率。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1是根據本公開數據驗證方法的一個實施例的流程圖;
圖2是根據本公開評分模型的訓練方法的一個實施例的流程圖;
圖3是根據本公開數據驗證裝置的實施例的結構示意圖;
圖4是用來實現本公開實施例的數據驗證方法的電子設備的框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110446545.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





