[發(fā)明專利]知識數(shù)據(jù)的處理方法和設備在審
| 申請?zhí)枺?/td> | 201710354503.2 | 申請日: | 2017-05-18 |
| 公開(公告)號: | CN108959290A | 公開(公告)日: | 2018-12-07 |
| 發(fā)明(設計)人: | 潘征;劉忠華;劉春辰 | 申請(專利權(quán))人: | 日本電氣株式會社 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 唐文靜 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識數(shù)據(jù) 檢測 結(jié)構(gòu)化知識 方法和設備 參考 沖突檢測 數(shù)據(jù)處理 準確率 推理 沖突 分析 | ||
本發(fā)明實施例提出了一種知識數(shù)據(jù)的處理方法和設備。所述方法包括:獲取待檢測的知識數(shù)據(jù);分析待檢測的知識數(shù)據(jù),得到待檢測的知識數(shù)據(jù)的結(jié)構(gòu)化知識;檢測待檢測的知識數(shù)據(jù)與已有參考知識數(shù)據(jù)是否存在沖突。其中,所述檢測包括將待檢測的知識數(shù)據(jù)的結(jié)構(gòu)化知識與根據(jù)兩條或兩條以上已有參考知識數(shù)據(jù)的結(jié)構(gòu)化知識基于知識推理得到的結(jié)構(gòu)化知識進行比較,以確定待檢測的知識數(shù)據(jù)與已有參考知識數(shù)據(jù)是否存在沖突。根據(jù)本發(fā)明實施例的知識數(shù)據(jù)處理方法可以提高沖突檢測的準確率。
技術領域
本發(fā)明一般地涉及數(shù)據(jù)處理技術領域,特別地涉及一種知識數(shù)據(jù)的處理方法和處理設備。
背景技術
隨著互聯(lián)網(wǎng)的發(fā)展,人們獲取知識的渠道越來越豐富,除了各領域的專家知識庫,各類互聯(lián)網(wǎng)知識庫也應運而生,如維基百科、百度百科等。專家知識庫主要來自領域?qū)<业淖陨斫?jīng)驗,隨著技術的發(fā)展面臨著知識的更新。互聯(lián)網(wǎng)知識庫由互聯(lián)網(wǎng)用戶參與建立,有可能存在錯誤的知識。對于來自不同數(shù)據(jù)源的知識,同一知識主題的知識數(shù)據(jù)之間可能存在差異,甚至會存在彼此沖突或錯誤。
因此,在使用多個知識數(shù)據(jù)源中的知識數(shù)據(jù)構(gòu)建知識庫時,需要對其中的知識數(shù)據(jù)進行處理,檢測出知識數(shù)據(jù)之間的沖突,排除錯誤的知識。
現(xiàn)有的技術在檢測知識沖突時,通常考慮將新知識與知識庫中的已有知識逐條對比檢測,但沒有考慮新知識與知識庫中多條知識的組合之間存在沖突。因此,現(xiàn)有專利無法檢測出新知識與知識庫中知識的所有沖突,從而使得知識庫中的知識數(shù)據(jù)準確率較低
因此,需要一種準確度更高的處理知識數(shù)據(jù)的機制。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術的至少一些缺陷,本發(fā)明實施例提出了一種知識數(shù)據(jù)的處理方法和設備,其在檢測知識沖突時,不僅考慮了新知識與知識庫中的各條已有知識之間是否存在沖突,而且考慮了新知識與知識庫中的多條知識的組合之間是否存在沖突。因此,提高了沖突檢測準確率。相應地,可以提高建成的知識庫中的知識數(shù)據(jù)的準確率。
根據(jù)本發(fā)明的第一方面,提供了一種知識數(shù)據(jù)的處理方法。所述方法包括:獲取待檢測的知識數(shù)據(jù);分析待檢測的知識數(shù)據(jù),得到待檢測的知識數(shù)據(jù)的結(jié)構(gòu)化知識;檢測待檢測的知識數(shù)據(jù)與已有參考知識數(shù)據(jù)是否存在沖突。其中,所述檢測包括將待檢測的知識數(shù)據(jù)的結(jié)構(gòu)化知識與根據(jù)兩條或兩條以上已有參考知識數(shù)據(jù)的結(jié)構(gòu)化知識基于知識推理得到的結(jié)構(gòu)化知識進行比較,以確定待檢測的知識數(shù)據(jù)與已有參考知識數(shù)據(jù)是否存在沖突。
在一些實施例中,所述方法還包括:在檢測待檢測的知識數(shù)據(jù)與已有參考知識數(shù)據(jù)是否存在沖突之前,根據(jù)預設的屬性約束檢測規(guī)則,確定待檢測的知識數(shù)據(jù)的結(jié)構(gòu)化知識是否滿足預設的屬性約束條件。
在一些實施例中,所述知識數(shù)據(jù)包括因果知識數(shù)據(jù),所述知識推理包括因果知識推理,以及所述沖突包括因果關系沖突。
在一些實施例中,因果知識數(shù)據(jù)包括以下至少一種:
A→B,表示A是B的直接原因;
表示A不是B的直接原因;
A-B,表示A和B之間有直接的因果關系;
A⊥B,表示A和B不會相互影響;
表示A會影響B(tài);
表示A不會影響B(tài);
A~B,表示A和B是有關聯(lián)的;
A≤B,表示在因果鏈上A的次序優(yōu)先于B,
其中A表示因果知識數(shù)據(jù)中的主體,B表示因果知識數(shù)據(jù)中的客體,A和B之間的符號表示因果知識數(shù)據(jù)中的謂詞。
在一些實施例中,因果知識推理包括以下中的至少一項:
根據(jù)已有參考知識數(shù)據(jù)A→B和B→C,推理得到A→B,B→C和
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于日本電氣株式會社,未經(jīng)日本電氣株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710354503.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:網(wǎng)站類別獲取方法和裝置
- 下一篇:查詢方法及相關裝置
- 結(jié)構(gòu)化數(shù)據(jù)的知識挖掘方法及系統(tǒng)
- 知識圖譜的構(gòu)建方法、系統(tǒng)、設備及存儲介質(zhì)
- 一種醫(yī)學知識管理和查詢系統(tǒng)
- 一種知識圖譜構(gòu)建方法、裝置及系統(tǒng)
- 油氣勘探開發(fā)領域的知識圖譜的構(gòu)建方法及裝置
- 一種數(shù)據(jù)處理方法及裝置
- 結(jié)構(gòu)化知識質(zhì)量提升方法及設備
- 一種基于區(qū)塊鏈技術的數(shù)字檔案管理方法及系統(tǒng)
- 知識圖譜的構(gòu)建方法、裝置、存儲介質(zhì)和電子設備
- 一種知識圖譜系統(tǒng)搭建方法及裝置





