[發明專利]一種實體關聯方法、裝置、電子設備及存儲介質有效
| 申請號: | 202110582345.2 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113032584B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 崔小波 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06K9/62 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 孔默 |
| 地址: | 100000 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實體 關聯 方法 裝置 電子設備 存儲 介質 | ||
本申請提供了一種實體關聯方法、裝置、電子設備及存儲介質,屬于數據分析技術領域。所述實體關聯方法包括:基于待檢測文檔中的文檔實體列表,獲取知識圖譜數據庫中與所述文檔實體列表中的每個文檔實體相對應的每個匹配實體以及與每個所述匹配實體相關聯的關系實體;根據所述待檢測文檔和所述匹配實體屬性,確定第一相似度;根據所述待檢測文檔的所述文本摘要和所述匹配實體,確定第二相似度;根據所述待檢測文檔的所述文本摘要、所述匹配實體以及所述關系實體,確定第三相似度。本申請可以有效的提高實體關聯的準確率和召回率,且可以在前端展示的時候能夠直接展示關聯的類別,提高實體的類別或場景關聯能力。
技術領域
本申請涉及數據分析技術領域,尤其是涉及一種實體關聯方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網、知識工程和人工智能的興起和快速發展,文本數據發生了爆炸式的增長,人們迫切需要高效、智能的文本分析技術,來理解數據的真實意義,從而幫助人們或組織快速獲取有用的信息。實體關聯技術是一種文本分析技術,它將文本數據中出現的詞或詞組做為實體,關聯到知識圖譜庫中對應的實體標識。這樣,人們就可以通過實體關聯來理解文本數據的真實含義,為我們理解文本數據的語義信息提供了很大便利。
然而現有技術中,當前實體關聯的方法存在一定的問題,一是,權重大小如何設置,現有技術中通常情況下是經驗或者測試數據驗證來設置權重,這種設置方法存在很多問題,如:有些計算分值權重該大的,但是設置小了,結果實體鏈接失敗;二是,根據結算結果得出鏈接的實體,但是根據實體,無法直接獲取相關實體所在的類別,導致實體關聯的類別和關聯場景的能力弱且關聯性不準確。
發明內容
有鑒于此,本申請的目的在于提供一種實體關聯方法、裝置、電子設備及存儲介質,通過獲取知識圖譜數據庫中與待檢測的文檔實體列表中的每個文檔實體相對應的每個匹配實體以及與每個所述匹配實體相關聯的關系實體,并通過文本摘要和文檔實體所在的句子的類別來設置相似度,并計算權重,有效的提高實體關聯的準確率和召回率,且通過知識圖譜中關聯到的匹配實體進行匹配實體類別的關聯,從而在前端展示的時候能夠直接展示關聯的類別,提高實體的類別或場景關聯能力。
本申請主要包括以下幾個方面:
第一方面,本申請實施例提供了一種實體關聯方法,所述實體關聯方法包括:
獲取待檢測文檔中的文檔實體列表和所述待檢測文檔的文本摘要;
基于待檢測文檔中的文檔實體列表,獲取知識圖譜數據庫中與所述文檔實體列表中的每個文檔實體相對應的每個匹配實體以及與每個所述匹配實體相關聯的關系實體;其中,每個所述匹配實體包括匹配實體名稱、匹配實體屬性以及匹配實體關系,每個所述關系實體包括關系實體名稱和關系實體屬性;
根據所述待檢測文檔和所述匹配實體屬性,確定第一相似度;根據所述待檢測文檔的所述文本摘要和所述匹配實體,確定第二相似度;根據所述待檢測文檔的所述文本摘要、所述匹配實體以及所述關系實體,確定第三相似度;
針對所述文檔實體列表中每個所述文檔實體相對應的每個所述匹配實體的所述第一相似度、所述第二相似度以及所述第三相似度按照相似度比例配置權重系數,并按照配置后的所述權重系數對每個所述匹配實體的所述第一相似度、所述第二相似度以及所述第三相似度進行求和,并在多個所述匹配實體中確定一個匹配實體的相似度最大值;
將所述匹配實體的所述相似度最大值與預設閾值進行對比,并將所述最大值大于所述預設閾值的所述待檢測文檔中的文檔實體與所述知識圖譜數據庫關聯,并獲取該文檔實體與所述知識圖譜數據庫中相關聯的關系實體以及所述關系實體的實體類別。
在一種可能的實施方式中,通過以下方式獲取待檢測文檔中的文檔實體列表:
通過訓練好的實體識別模型對待檢測文檔進行實體識別,獲取文檔實體列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110582345.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于物聯網的AOI檢測反饋系統
- 下一篇:一種全自動磁微粒包被儀





