[發(fā)明專利]一種識別知識圖譜中錯誤關(guān)系的方法和設(shè)備在審
| 申請?zhí)枺?/td> | 202011402066.5 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112559759A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計)人: | 史亞飛 | 申請(專利權(quán))人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 知識 圖譜 錯誤 關(guān)系 方法 設(shè)備 | ||
1.一種識別知識圖譜中錯誤關(guān)系的方法,其特征在于,包括:
通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系;
確定所述候選錯誤關(guān)系中頭實體與尾實體兩者的類型;
基于所述頭實體與所述尾實體兩者的類型與二分類模型確定兩個所述實體關(guān)聯(lián)關(guān)系的最終置信度分值;
若最終置信度分值小于最終預(yù)設(shè)閾值,則確定所述候選錯誤關(guān)系為所述知識圖譜中的錯誤關(guān)系。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述“通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系”,包括:
通過圖神經(jīng)網(wǎng)絡(luò)確定知識圖譜中兩個實體之間的初始關(guān)系置信度;兩個所述實體中的一個為頭實體,另一個為尾實體;
若所述初始關(guān)系置信度小于初始預(yù)設(shè)閾值,則將兩個所述實體之間的關(guān)系設(shè)為候選錯誤關(guān)系。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述初始關(guān)系置信度是基于以下公式來進(jìn)行計算的:
R(h,t)=λ1×R1(h,t)+λ2×R2(h,t)+λ3×R3(h,t);
R(h,t)為初始關(guān)系置信度;λ1,λ2,λ3均為超參數(shù);
R1(h,t)=W2u+b2;u=α(W1V+b1);W1,W2,b1,b2均為訓(xùn)練出的參數(shù);V為所述頭實體的出度、所述頭實體的入度、所述尾實體的出度、所述尾實體的入度、頭所述實體到所述尾實體路徑的個數(shù)、所述頭實體到所述尾實體路徑的平均深度、所述尾實體的資源的組合;
R2(h,t)為所述頭實體與所述尾實體之間直接關(guān)系的置信度;
R3(h,t)為所述頭實體與所述尾實體之間多步路徑的置信度。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述尾實體的資源通過以下公式計算:
其中,R(t|h)表示所述尾實體的資源,Mt表示所有指向所述尾實體的實體集合,OD(ei)表示實體ei的出度,θ表示資源流向所述知識圖譜中任意實體的概率,N表示所述知識圖譜實體總的數(shù)量。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述頭實體與所述尾實體之間直接關(guān)系的置信度是基于TransE計算得到的。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述頭實體與所述尾實體之間多步路徑的置信度是基于PTransE計算得到的。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述二分類模型是基于有監(jiān)督的方法訓(xùn)練出的。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系,之后還包括:
將所述候選錯誤關(guān)系放入錯誤關(guān)系候選集合;
所述“確定所述候選錯誤關(guān)系中頭實體與尾實體兩者的類型”,包括:
確定所述錯誤關(guān)系候選集合中的每個所述候選錯誤關(guān)系頭實體與尾實體兩者的類型。
9.一種識別知識圖譜中錯誤關(guān)系的設(shè)備,其特征在于,包括:
關(guān)系確定模塊,用于通過圖神經(jīng)網(wǎng)絡(luò)確定候選錯誤關(guān)系;
類型確定模塊,用于確定所述候選錯誤關(guān)系中頭實體與尾實體兩者的類型;
最終置信度分值模塊,用于基于所述頭實體與所述尾實體兩者的類型與二分類模型確定兩個所述實體關(guān)聯(lián)關(guān)系的最終置信度分值;
識別模塊,用于當(dāng)最終置信度分值小于最終預(yù)設(shè)閾值時,則確定所述候選錯誤關(guān)系為所述知識圖譜中的錯誤關(guān)系。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,所述關(guān)系確定模塊,用于:
通過圖神經(jīng)網(wǎng)絡(luò)確定知識圖譜中兩個實體之間的初始關(guān)系置信度;兩個所述實體中的一個為頭實體,另一個為尾實體;
若所述初始關(guān)系置信度小于初始預(yù)設(shè)閾值,則將兩個所述實體之間的關(guān)系設(shè)為候選錯誤關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經(jīng)云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011402066.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機(jī)設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





