[發(fā)明專利]一種識別知識圖譜中錯誤關(guān)系的方法和設(shè)備在審
| 申請?zhí)枺?/td> | 202011402066.5 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112559759A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計)人: | 史亞飛 | 申請(專利權(quán))人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 知識 圖譜 錯誤 關(guān)系 方法 設(shè)備 | ||
本發(fā)明涉及一種識別知識圖譜中錯誤關(guān)系的方法和設(shè)備,該方法包括:通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系;確定所述候選錯誤關(guān)系中頭實體與尾實體兩者的類型;基于所述頭實體與所述尾實體兩者的類型與二分類模型確定兩個所述實體關(guān)聯(lián)關(guān)系的最終置信度分值;若最終置信度分值小于最終預(yù)設(shè)閾值,則確定所述候選錯誤關(guān)系為所述知識圖譜中的錯誤關(guān)系。本方案基于圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系;然后基于兩個實體的類型與二分類模型確定兩個所述實體關(guān)聯(lián)關(guān)系的最終置信度分值;并基于最終置信度分值對知識圖譜中的錯誤關(guān)系進(jìn)行識別,有效提高了識別的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種識別知識圖譜中錯誤關(guān)系的方法和設(shè)備。
背景技術(shù)
知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領(lǐng)域映射地圖,是顯示知識發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系。知識圖譜,是通過將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法與計量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,并利用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識架構(gòu)達(dá)到多學(xué)科融合目的的現(xiàn)代理論。
具體的知識圖譜能為學(xué)科研究提供切實的、有價值的參考。但是知識圖譜也可能存在錯誤的關(guān)系,在此情況下需要識別出其中的錯誤關(guān)系,但是現(xiàn)有的識別錯誤關(guān)系的方式中,首先融合三元組結(jié)構(gòu)信息向量和三元組描述信息詞向量,然后將融合后的向量輸入膠囊網(wǎng)絡(luò)進(jìn)行評分,基于分?jǐn)?shù)評價三元組的真實性,以此對知識圖譜中的錯誤關(guān)系進(jìn)行識別,這種方式?jīng)]有考慮從資源流動的角度衡量三元組的關(guān)聯(lián)強度,沒有考慮三元組之間的多路徑結(jié)構(gòu)信息,導(dǎo)致識別的準(zhǔn)確率不高。
由此,目前需要有一種更好的方案來解決現(xiàn)有技術(shù)中的該問題。
發(fā)明內(nèi)容
本發(fā)明提供一種識別知識圖譜中錯誤關(guān)系的方法和設(shè)備,能夠解決識別準(zhǔn)確率不高的技術(shù)問題。
本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:
本發(fā)明實施例提出了一種識別知識圖譜中錯誤關(guān)系的方法,其特征在于,包括:
通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系;
確定所述候選錯誤關(guān)系中頭實體與尾實體兩者的類型;
基于所述頭實體與所述尾實體兩者的類型與二分類模型確定兩個所述實體關(guān)聯(lián)關(guān)系的最終置信度分值;
若最終置信度分值小于最終預(yù)設(shè)閾值,則確定所述候選錯誤關(guān)系為所述知識圖譜中的錯誤關(guān)系。
在一個具體的實施例中,所述“通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系”,包括:
通過圖神經(jīng)網(wǎng)絡(luò)確定知識圖譜中兩個實體之間的初始關(guān)系置信度;兩個所述實體中的一個為頭實體,另一個為尾實體;
若所述初始關(guān)系置信度小于初始預(yù)設(shè)閾值,則將兩個所述實體之間的關(guān)系設(shè)為候選錯誤關(guān)系。
在一個具體的實施例中,所述初始關(guān)系置信度是基于以下公式來進(jìn)行計算的:
R(h,t)=λ1×R1(h,t)+λ2×R2(h,t)+λ3×R3(h,t);
R(h,t)為初始關(guān)系置信度;λ1,λ2,λ3均為超參數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經(jīng)云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011402066.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





