[發明專利]基于深度學習的知識圖譜構建方法、設備及存儲介質有效
| 申請號: | 202110902458.6 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113722501B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 李勁;齊文;郭瑋;蘇力強 | 申請(專利權)人: | 深圳清華大學研究院 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/33;G06N3/088 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 廖慧賢 |
| 地址: | 518000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 知識 圖譜 構建 方法 設備 存儲 介質 | ||
本發明公開了一種基于深度學習的知識圖譜構建方法、設備及存儲介質,基于深度學習的知識圖譜構建方法包括:獲取已構建知識圖譜,并提取已構建知識圖譜中的第一實體信息;采集第一實體信息在已構建知識圖譜中相關的信息以得到數據集合;獲取數據集合中與第一實體信息相關的多個自然段語句;根據預設非監督深度學習模型將多個自然段語句進行分類以得到多個分類結果;獲取多個分類結果中分類結果符合預設條件的自然段語句以得到相關性語句,并根據相關性語句增加已構建知識圖譜中與第一實體信息對應的第二實體信息、關系信息。本發明根據新獲得的第二實體信息、關系信息修改已構建知識圖譜,從而得到更加準確和完整的知識圖譜。
技術領域
本發明涉及深度學習的技術領域,尤其是涉及一種基于深度學習的知識圖譜構建方法、設備及存儲介質。
背景技術
知識圖譜(Knowledge?Graph)通常指可揭示實體之間的關系的語義網絡,其基于數據挖掘、信息處理、圖形繪制等手段,利用可視化的圖譜將復雜的知識領域形象地展示出來,可在一定程度上體現知識領域的發展規律。
隨著大數據時代的發展,人們對于知識圖譜的要求不再是簡單的關系鏈,對知識圖譜的完備度、準確性也有了較高的要求,但是相關技術中的知識圖譜構建成本高且完備性較難保證,導致知識推理計算的準確度較低。
發明內容
本發明旨在至少解決現有技術中存在的技術問題之一。為此,本發明提出一種基于深度學習的知識圖譜構建方法,能夠提高知識圖譜的完整性和準確性。
本發明還提出一種電子控制設備。
本發明還提出一種計算機可讀存儲介質。
第一方面,本發明的一個實施例提供了基于深度學習的知識圖譜構建方法,包括:
獲取已構建知識圖譜,并提取所述已構建知識圖譜中的第一實體信息;
采集所述第一實體信息在所述已構建知識圖譜中相關的信息以得到數據集合;
獲取所述數據集合中與所述第一實體信息相關的多個自然段語句;
根據預設非監督深度學習模型將多個所述自然段語句進行分類以得到多個分類結果;
獲取多個所述分類結果中所述分類結果符合預設條件的所述自然段語句以得到相關性語句,并根據所述相關性語句增加所述已構建知識圖譜中與所述第一實體信息對應的第二實體信息、關系信息。
本發明實施例的基于深度學習的知識圖譜構建方法至少具有如下有益效果:根據新獲得的第二實體信息、關系信息修改已構建知識圖譜中第一實體信息的關系結構,以不斷完善已構建知識圖譜,從而得到更加準確和完整的知識圖譜。
根據本發明的另一些實施例的基于深度學習的知識圖譜構建方法,所述根據預設非監督深度學習模型將多個所述自然段語句進行分類以得到多個分類結果,包括:
所述預設非監督深度學習模型將多個所述自然段語句拆分為預設模式結構以得到語句模式結構,所述預設模式結構為第一實體信息和/或關系信息和/或第二實體信息;
根據所述預設非監督深度學習模型計算所述語句模式結構和所述第一實體信息的可信度;
根據所述多個自然段語句的語句模式結構以及對應的所述可信度確定所述分類結果。
根據本發明的另一些實施例的基于深度學習的知識圖譜構建方法,所述預設條件包括:基準模式結構、預設可信度閾值。
根據本發明的另一些實施例的基于深度學習的知識圖譜構建方法,還包括:
若所述自然段語句的所述語句模式結構不符合所述基準模式結構,和/或所述可信度低于所述預設可信度閾值,則將對應的所述自然段語句剔除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳清華大學研究院,未經深圳清華大學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110902458.6/2.html,轉載請聲明來源鉆瓜專利網。





