[發明專利]司法知識圖譜構建以及基于司法知識圖譜搜索方法與裝置在審
| 申請號: | 201911044184.0 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN112749249A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 戚成琳;馮鴛鶴 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F16/9535 |
| 代理公司: | 北京華進京聯知識產權代理有限公司 11606 | 代理人: | 喬改利 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 司法 知識 圖譜 構建 以及 基于 搜索 方法 裝置 | ||
本申請涉及一種上述司法知識圖譜構建方法、裝置、計算機設備和存儲介質,在構建司法知識圖譜時,根據模式設計數據有針對性的從預設司法文書數據庫中抽取數據,并且對抽取的數據中節點類型數據進行融合,再抽取數據之間的關系數據,準確得到與當前設計需求對應節點數據以及關系數據作為司法知識圖譜的基礎,確保最終構建的司法知識譜圖攜帶多樣有序的數據,支持后續準確搜索,實現司法知識圖譜的準確構建。另外本申請還提供一種基于上述司法知識圖譜構建方法構建的司法知識圖譜搜索方法、裝置、計算機設備和存儲介質,實現司法文書數據準確搜索。
技術領域
本申請涉及大數據處理技術領域,特別是涉及一種司法知識圖譜構建方法、裝置、計算機設備和存儲介質以及基于司法知識圖譜搜索方法、裝置、計算機設備和存儲介質。
背景技術
互聯網時代,人們面對海量信息,依靠搜索引擎,才能迅速找到需要的信息,常規搜索引擎類型越來越多,包括綜合搜索、商業搜素、軟件搜索等。
在傳統基于搜索引擎的搜索過程中,一般是用戶輸入關鍵字進行至常規搜索引擎,常規搜索引擎基于使用ES庫對數據進行存儲,通過關鍵詞進行搜索,并對搜索結果進行排序,從而返回用戶想要搜索的信息。
常規搜索引擎雖然可以輸出用戶關鍵字對應的數據,但是由于一般基于普通的數據庫進行搜索,其搜索結果內容有限,需要從海量數據進行無序搜索,導致搜索過程復雜且結果不準確。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠支持準確搜索的司法知識圖譜構建方法、裝置、計算機設備和存儲介質以及能夠實現準確搜索的基于司法知識圖譜搜索方法、裝置、計算機設備和存儲介質。
一種司法知識圖譜構建方法,所述方法包括:
獲取待構建司法知識圖譜的模式設計數據;
根據所述模式設計數據從預設司法文書數據庫中抽取對應的數據;
對抽取的數據中節點類型對應的數據進行融合,得到節點數據,并獲取所述節點數據之間的關系數據;
根據所述節點數據以及所述關系數據,構建司法知識圖譜。
在其中一個實施例中,所述對抽取的數據中節點類型數據進行融合,得到節點數據包括:
識別抽取的數據中未攜帶唯一身份標識的節點類型數據,得到目標數據;
對所述目標數據進行融合,得到節點數據。
在其中一個實施例中,所述對所述目標數據進行融合,得到節點數據包括:
獲取抽取的數據中與所述目標數據對應的節點屬性數據;
根據所述目標數據中各節點類型對應的節點屬性數據,采用杰卡德相似系數,獲取所述目標數據中各節點類型的相似度向量;
將所述相似度向量輸入至聚類模型,得到融合節點數據。
在其中一個實施例中,所述根據所述節點數據以及所述關系數據,構建司法知識圖譜包括:
根據預設數據導入工具支持數據格式,對所述節點數據以及所述關系數據進行格式轉換;
通過所述預設導入工具將格式轉換后的數據導入至圖數據庫,構建司法知識圖譜。
另外,本申請還提供一種基于司法知識圖譜的搜索方法,所述方法包括:
接收用戶輸入的自然語言問題;
對所述自然語言問題進行搜索意圖識別;
根據搜索意圖識別結果以及司法知識圖譜進行搜索,得到搜索結果,所述司法知識圖譜為采用如上述方法構建的司法知識圖譜;
反饋所述搜索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911044184.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電控變色玻璃
- 下一篇:數據傳輸的控制方法和裝置





