[發(fā)明專利]基于知識圖譜的法條檢索方法、系統(tǒng)、裝置及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911031835.2 | 申請日: | 2019-10-28 |
| 公開(公告)號: | CN111143521B | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計)人: | 方清 | 申請(專利權(quán))人: | 廣州恒巨信息科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/36;G06Q50/18;G06F40/289 |
| 代理公司: | 廣州嘉權(quán)專利商標事務(wù)所有限公司 44205 | 代理人: | 何文聰 |
| 地址: | 510630 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 知識 圖譜 法條 檢索 方法 系統(tǒng) 裝置 存儲 介質(zhì) | ||
本發(fā)明公開了一種基于知識圖譜的法條檢索方法、系統(tǒng)、裝置及存儲介質(zhì)通過獲取法律相關(guān)的語料,并構(gòu)建得到法律知識圖譜,獲取法律法條數(shù)據(jù)庫,檢測法律法條數(shù)據(jù)庫中的每條法律法條在法律知識圖譜的關(guān)系,獲取輸入的搜索文本,檢測搜索文本在法律知識圖譜的關(guān)系,根據(jù)所述搜索文本分別與各所述法律法條之間的相似權(quán)重,對各所述法律法條按照預設(shè)的排列方式進行排列,形成得到法條檢索結(jié)果。本發(fā)明通過構(gòu)建法律知識圖譜,并基于法律知識圖譜對搜索文本與法律法條進行相似計算,從而能快速得出推薦的法律法條,并且還能大大提高法律的檢索準確性。本發(fā)明可廣泛應(yīng)用于法律檢索領(lǐng)域中。
技術(shù)領(lǐng)域
本發(fā)明涉及知識工程技術(shù)領(lǐng)域,尤其涉及一種基于知識圖譜的法條檢索方法、系統(tǒng)、裝置及存儲介質(zhì)。
背景技術(shù)
知識圖譜,2012年由谷歌正式發(fā)布,是一種知識庫,用于知識的管理,以便于有關(guān)領(lǐng)域知識的采集、整理以及提取。知識圖譜旨在描述真實世界中存在的各種實體或概念及其關(guān)系,其構(gòu)成一張巨大的語義網(wǎng)絡(luò)圖,節(jié)點表示實體或概念,邊則由屬性或關(guān)系構(gòu)成。現(xiàn)在的知識圖譜已被用來泛指各種大規(guī)模的知識庫。
一方面,隨著語義Web數(shù)據(jù)的數(shù)量激增,產(chǎn)生了大量的RDF數(shù)據(jù)。互聯(lián)網(wǎng)變成包含大量描述各種實體和實體之間豐富關(guān)系的數(shù)據(jù)萬維網(wǎng)。在此基礎(chǔ)上,以谷歌為代表的各大檢索引擎公司紛紛構(gòu)建知識圖譜來改善檢索質(zhì)量,從而拉開了語義檢索的序幕。知識圖譜顯著提高檢索引擎和檢索系統(tǒng)的質(zhì)量。
另一方面,隨著深度學習的發(fā)展,自然語言處理領(lǐng)域的難題也不斷突破,機器正在理解人類的語言,這使得自動構(gòu)建大型知識圖譜成為可能。WordNet、DBpedia、Freebase、WikiData等大型通用知識圖譜相繼發(fā)布。先進的技術(shù)在我們的生活中創(chuàng)造越來越多的價值。法制社會更是與每個人的生活息息相關(guān)。但由于需要領(lǐng)域?qū)<业拇罅咳斯じ深A,基于法律領(lǐng)域的知識圖譜的構(gòu)建,進展卻一直十分緩慢。
追溯起來,人工智能和法律的結(jié)合始于1987年在美國波士頓的東北大學舉辦的首屆國際人工智能與法律會議,建立基于法律和案例的推理模型或知識系統(tǒng)等應(yīng)用是精準、高效辦案的迫切需求。由于法律是一種概括、普遍、嚴謹?shù)男袨橐?guī)范,這種規(guī)范由特殊的邏輯所構(gòu)成,目前并沒有相關(guān)的技術(shù)或方法,直接基于法律文本構(gòu)建知識圖譜,從而法律檢索的準確性得不到有效的提升。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種能提高檢索準確性的靜基于知識圖譜的法條檢索方法、系統(tǒng)、裝置及存儲介質(zhì)。
第一方面,本發(fā)明實施例提供了一種基于知識圖譜的法條檢索方法,包括以下步驟:
獲取法律相關(guān)的語料,并構(gòu)建得到法律知識圖譜;
獲取法律法條數(shù)據(jù)庫,檢測法律法條數(shù)據(jù)庫中的每條法律法條在法律知識圖譜的關(guān)系,得出每條法律法條對應(yīng)的第一實體關(guān)系集合列表;
獲取輸入的搜索文本,檢測搜索文本在法律知識圖譜的關(guān)系,得出第二實體關(guān)系集合列表;
計算各所述法律法條對應(yīng)的第一實體關(guān)系集合列表中實體關(guān)系集合與第二實體關(guān)系集合列表中實體關(guān)系集合的交集,得到多個交集;
根據(jù)得到的多個交集,計算得出所述搜索文本分別與各所述法律法條之間的相似權(quán)重;
根據(jù)所述搜索文本分別與各所述法律法條之間的相似權(quán)重,對各所述法律法條按照預設(shè)的排列方式進行排列,形成得到法條檢索結(jié)果。
作為所述的一種基于知識圖譜的法條檢索方法的進一步改進,所述的獲取法律相關(guān)的語料,并構(gòu)建得到法律知識圖譜,這一步驟具體包括:
獲取法律相關(guān)的文檔作為語料;
對所述文檔進行預處理,得出實體詞庫;
通過詞袋模型將所述文檔進行向量化處理,得到文檔向量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州恒巨信息科技有限公司,未經(jīng)廣州恒巨信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911031835.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





