[發明專利]一種知識圖譜的擴展方法、裝置、存儲介質和計算設備有效
| 申請號: | 202010884220.0 | 申請日: | 2020-08-28 |
| 公開(公告)號: | CN112100324B | 公開(公告)日: | 2023-05-05 |
| 發明(設計)人: | 陳開冉;黎展;謝智權 | 申請(專利權)人: | 廣州探跡科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F40/211;G06F40/295 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 顏希文;郝傳鑫 |
| 地址: | 511400 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 擴展 方法 裝置 存儲 介質 計算 設備 | ||
本發明提供了一種基于貪婪實體鏈接的知識圖譜自動校驗迭代的方法、裝置、存儲介質和計算設備,包括:獲取外部文本信息;根據外部文本信息,生成事件列表;將事件列表里的事件實體和核心數據庫實體進行實體嵌入編碼后,進行事件實體與核心數據庫實體的相似度排序;若事件實體與核心數據庫實體的最大相似度大于預設第一閾值,則將事件實體插入核心數據庫;若事件實體與核心數據庫實體的最大相似度小于預設第一閾值,則對事件實體進行屬性補全,若補全后的事件實體與核心數據庫實體的最大相似度大于預設第一閾值,則將屬性補全后的事件實體插入核心數據庫。采用該知識圖譜的擴展方法、裝置、存儲介質和計算設備,可以解決知識圖譜擴展時人工依賴強,對部分知識無法進行自動校驗和擴展的問題。
技術領域
本發明涉及知識圖譜擴展領域,尤其涉及一種知識圖譜的擴展方法的方法、裝置、存儲介質和計算設備。
背景技術
構建垂直領域(企業)知識圖譜的傳統流程,均要經歷本體庫定義、實體庫建立、關系屬性集建立,關系抽取等環節。每個環節需要人工某程度的參與。對于垂直領域與通用領域有交集的先驗知識梳理,通常由人工加工,嵌在各個環節中,由于人工介入的環節較多,當知識圖譜需要進行知識更新的時候,人力成本巨大,也導致整個圖譜的迭代效率緩慢。
發明內容
為了解決上述技術問題中的至少一個,本發明提供了一種圖譜擴展的方法、裝置、存儲介質和計算設備。解決知識圖譜中的知識迭代更新緩慢,更新過程中對人工依賴太強、對于部分知識無法做到自動校驗和擴展的問題。
本發明的目的通過以下方案實現:
一種知識圖譜的擴展方法,包括:
獲取外部文本信息;
根據所述外部文本信息,生成事件列表;
將所述事件列表里的事件實體和核心數據庫實體進行實體嵌入編碼后,進行所述事件實體與所述核心數據庫實體的相似度排序;
若所述事件實體與所述核心數據庫實體的最大相似度大于預設第一閾值,則將所述事件實體插入所述核心數據庫;
若所述事件實體與所述核心數據庫實體的最大相似度小于預設第一閾值,則對所述事件實體進行屬性補全,若補全后的所述事件實體與核心數據庫實體的最大相似度大于預設第一閾值,則將屬性補全后的所述事件實體插入所述核心數據庫。
進一步地,根據所述外部文本信息,生成事件列表包括:
將所述外部文本切分為段落;
將所述段落切分為句子;
獲取所述句子的(S、O、B、T)四元組屬性;
將所述句子的(S、O、B、T)四元組屬性合并為句子圖;
將所述句子圖合并為段落圖;
通過所述段落圖,生成所述事件列表。
進一步地,對所述事件實體進行屬性補全包括:
選取與所述事件實體相似度最高的指定個數的候選核心數據庫實體;
依次根據所述候選核心數據庫實體對所述事件實體進行屬性補全;
進行屬性補全后的所述事件實體與所述候選核心數據庫實體的相似度排序;
若屬性補全后的所述事件實體與所述候選核心數據庫實體的最大相似度大于預設第一閾值,則將屬性補全后的所述事件實體插入所述核心數據庫。
若屬性補全后的所述事件實體與所述候選核心數據庫實體的最大相似度小于預設第一閾值,則將屬性補全后的所述事件實體放入潛意識模塊。
進一步地,在所述事件實體進行屬性補全之前,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州探跡科技有限公司,未經廣州探跡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010884220.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通信方法及裝置
- 下一篇:一種車載空調風機控制方法、存儲介質及系統





