[發明專利]用于構建知識圖譜的方法及裝置、電子設備、存儲介質在審
| 申請號: | 202210405739.5 | 申請日: | 2022-04-18 |
| 公開(公告)號: | CN114756690A | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 于皓;張杰 | 申請(專利權)人: | 北京明略昭輝科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/30;G06F40/216 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 陶俊潔 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 構建 知識 圖譜 方法 裝置 電子設備 存儲 介質 | ||
本申請涉及知識圖譜技術領域,公開一種用于構建知識圖譜的方法,包括:獲取第一語料數據;將第一語料數據輸入預設的知識抽取模型,獲得若干個第一實體向量、各第一實體向量對應的第一實體類型和各第一實體向量對應的第一實體關系;按照第一實體類型將各第一實體向量分成若干向量分組;對各向量分組中的第一實體向量進行語義聚類,獲得各向量分組分別對應的實體類簇;根據各第一實體關系連接各實體類簇,獲得知識圖譜。這樣,減少了知識圖譜中冗雜的實體關系,使得知識圖譜呈現的實體與實體之間的實體關系更簡潔,更便于用戶直觀的查看實體與實體之間的聯系。本申請還公開一種用于構建知識圖譜的裝置、服務器、存儲介質。
技術領域
本申請涉及知識圖譜技術領域,例如涉及一種用于構建知識圖譜的方法及裝置、電子設備、存儲介質。
背景技術
隨著科學技術的不斷發展,越來越多的領域運用到了知識圖譜。運用知識圖譜可以輔助進行數據分析與決策,也可以便于檢索、問答。通常用戶會提取數據中的各實體和實體之間的對應關系,然后直接根據實體和實體之間的關系依次進行連接從而構成知識圖譜。
在實現本公開實施例的過程中,發現相關技術中至少存在如下問題:
由于存在不同的實體表征的含義相同或相近的情況,若直接由實體和實體之間的關系依次進行連接構成知識圖譜,會導致知識圖譜呈現的實體與實體之間的實體關系冗雜,不便于用戶直觀的查看實體與實體之間的聯系。
發明內容
為了對披露的實施例的一些方面有基本的理解,下面給出了簡單的概括。所述概括不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍,而是作為后面的詳細說明的序言。
本公開實施例提供了一種用于構建知識圖譜的方法及裝置、電子設備、存儲介質,便于用戶直觀的查看實體與實體之間的聯系。
在一些實施例中,所述用于構建知識圖譜的方法,包括:獲取第一語料數據;將所述第一語料數據輸入預設的知識抽取模型,獲得若干個第一實體向量、各所述第一實體向量對應的第一實體類型和各第一實體向量對應的第一實體關系;按照第一實體類型將各第一實體向量分成若干向量分組;對各向量分組中的第一實體向量進行語義聚類,獲得各向量分組分別對應的實體類簇;根據各第一實體關系連接各實體類簇,獲得知識圖譜。
在一些實施例中,所述用于構建知識圖譜的裝置,包括:獲取模塊,被配置為獲取第一語料數據;確定模塊,被配置為將所述第一語料數據輸入預設的知識抽取模型,獲得若干個第一實體向量、各所述第一實體向量對應的第一實體類型和各第一實體向量對應的第一實體關系;分類模塊,被配置為按照第一實體類型將各第一實體向量分成若干向量分組;聚類模塊,被配置為對各向量分組中的第一實體向量進行語義聚類,獲得各向量分組分別對應的實體類簇;構建模塊,被配置為根據各第一實體關系連接各實體類簇,獲得知識圖譜。
在一些實施例中,所述電子設備,包括處理器和存儲有程序指令的存儲器,所述處理器被配置為在運行所述程序指令時,執行上述的用于構建知識圖譜的方法。
在一些實施例中,所述存儲介質,所述程序指令在運行時,執行上述的用于構建知識圖譜的方法。
本公開實施例提供的用于構建知識圖譜的方法及裝置、電子設備、存儲介質,可以實現以下技術效果:通過獲取第一語料數據;將第一語料數據輸入預設的知識抽取模型,獲得若干個第一實體向量、各第一實體向量對應的第一實體類型和各第一實體向量對應的第一實體關系;按照第一實體類型將各第一實體向量分成若干向量分組;對各向量分組中的第一實體向量進行語義聚類,獲得各向量分組分別對應的實體類簇;根據各第一實體關系連接各實體類簇,獲得知識圖譜。這樣,通過語義聚類先將表征的含義相同或相近的實體聚集在一起形成若干類簇,然后對各類簇進行連接,而不是每個實體與實體之間均進行連線,減少了知識圖譜中冗雜的實體關系,使得知識圖譜呈現的實體與實體之間的實體關系更簡潔,更便于用戶直觀的查看實體與實體之間的聯系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略昭輝科技有限公司,未經北京明略昭輝科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210405739.5/2.html,轉載請聲明來源鉆瓜專利網。





