[發(fā)明專利]知識圖譜構建方法、系統(tǒng)、設備及存儲介質有效
| 申請?zhí)枺?/td> | 202110902448.2 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113722500B | 公開(公告)日: | 2023-08-18 |
| 發(fā)明(設計)人: | 李勁;齊文;郭瑋;蘇力強 | 申請(專利權)人: | 深圳清華大學研究院 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/335;G06N3/088 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 廖慧賢 |
| 地址: | 518000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 構建 方法 系統(tǒng) 設備 存儲 介質 | ||
1.一種知識圖譜構建方法,其特征在于,包括:
獲取已構建知識圖譜;
提取所述已構建知識圖譜中關聯(lián)的第一實體信息和第二實體信息;
根據(jù)預設非監(jiān)督深度學習模型和預設信息數(shù)據(jù)庫確定檢測關系網(wǎng)絡,所述預設信息數(shù)據(jù)庫包括與所述第一實體信息、所述第二實體信息相關的信息:其中,所述預設信息數(shù)據(jù)庫內存儲的信息是通過第三方平臺采集與第一實體信息、第二實體信息相關的語句;
根據(jù)所述第一實體信息、所述第二實體信息、所述檢測關系網(wǎng)絡和預設非監(jiān)督深度學習模型確定所述第一實體信息和所述第二實體信息關聯(lián)的多個關系信息以及所述關系信息對應的可信度;其中,所述預設非監(jiān)督深度學習模型為屏蔽語言模型,在屏蔽語言建模中,屏蔽給定句子中特定可信度的單詞,模型期望基于該句子中的其他單詞預測這些被屏蔽的單詞,通過給定可信度的相關信息去調節(jié)屏蔽語言模型的參數(shù)以得到優(yōu)化的屏蔽語言模型,優(yōu)化后的屏蔽語言模型計算出關系信息與第一實體信息、第二實體信息的可信度;
根據(jù)多個所述關系信息的所述可信度和預設閾值增加所述已構建知識圖譜中所述第一實體信息和所述第二實體信息對應的關系信息。
2.根據(jù)權利要求1所述的知識圖譜構建方法,其特征在于,還包括:
獲取訓練數(shù)據(jù)集合,所述訓練數(shù)據(jù)集合包括:所述第一實體信息、所述第二實體信息與不同所述可信度的所述關系信息;
將所述訓練數(shù)據(jù)集合代入所述預設非監(jiān)督深度學習模型以調節(jié)所述預設非監(jiān)督深度學習的參數(shù)以得到優(yōu)化后的所述預設非監(jiān)督深度學習模型。
3.根據(jù)權利要求1所述的知識圖譜構建方法,其特征在于,所述根據(jù)所述第一實體信息、所述第二實體信息、所述檢測關系網(wǎng)絡和預設非監(jiān)督深度學習模型確定所述第一實體信息和所述第二實體信息關聯(lián)的多個關系信息以及所述關系信息對應的可信度,包括:
根據(jù)所述第一實體信息、所述第二實體信息代入所述檢測關系網(wǎng)絡以得到多個所述第一實體信息、所述第二實體信息關聯(lián)的多個關系信息;
根據(jù)所述預設非監(jiān)督深度學習模型計算多個所述關系信息與所述第一實體信息、所述第二實體的可信度以得到所述關系信息對應的所述可信度。
4.根據(jù)權利要求1所述的知識圖譜構建方法,其特征在于,還包括:
將所述可信度小于預設過濾閾值的所述關系信息濾除。
5.根據(jù)權利要求1至4任一項所述的知識圖譜構建方法,其特征在于,所述根據(jù)多個所述關系信息的所述可信度和預設閾值增加所述已構建知識圖譜中所述第一實體信息和所述第二實體信息對應的關系信息,包括:
若多個所述關系信息中任意一個所述關系信息的所述可信度大于所述預設閾值,獲取所述可信度大于所述預設閾值的關系信息,根據(jù)多個所述可信度的排序順序確定并添加所述已構建知識圖譜中所述第一實體信息和所述第二實體信息對應的所述關系信息;
若多個所述關系信息的所述可信度小于所述預設閾值,保持所述已構建知識圖中所述第一實體信息和所述第二實體信息對應的所述關系信息。
6.根據(jù)權利要求5所述的知識圖譜構建方法,其特征在于,所述若多個所述關系信息中任意一個所述關系信息的所述可信度大于所述預設閾值,獲取所述可信度大于所述預設閾值的關系信息,根據(jù)多個所述可信度的排序順序確定并添加所述已構建知識圖譜中所述第一實體信息和所述第二實體信息對應的所述關系信息,包括:
若多個所述關系信息中任意一個所述關系信息的所述可信度大于所述預設閾值,獲取所述可信度大于所述預設閾值的關系信息;
獲取多個所述可信度中最高的所述可信度對應的所述關系信息,并在所述已構建知識圖譜的所述第一實體信息和所述第二實體信息對應的所述關系信息中增加所述可信度最高的所述關系信息。
7.根據(jù)權利要求1至4任一項所述的知識圖譜構建方法,其特征在于,所述預設非監(jiān)督深度學習模型為屏蔽語言模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳清華大學研究院,未經(jīng)深圳清華大學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110902448.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





