[發(fā)明專利]一種基于語義抽取的相似案件檢索方法在審
| 申請?zhí)枺?/td> | 201810311762.1 | 申請日: | 2018-04-09 |
| 公開(公告)號: | CN108595547A | 公開(公告)日: | 2018-09-28 |
| 發(fā)明(設(shè)計)人: | 孟濤;李佳靜 | 申請(專利權(quán))人: | 南京網(wǎng)感至察信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q50/18 |
| 代理公司: | 南京源古知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32300 | 代理人: | 馬曉輝 |
| 地址: | 210001 江蘇省南京市秦淮區(qū)光華*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 案件 案件檢索 檢索 語義抽取 案例庫 裁判 語義 案例檢索 法律專業(yè) 檢索結(jié)果 檢索文件 檢索效率 建立索引 要素定義 專家定義 變量庫 索引庫 抽取 輸出 法律 | ||
本發(fā)明涉及一種基于語義抽取的相似案件檢索方法,包括如下步驟:1:獲取裁判文書,形成案例庫;2:法律專家定義案件中的案件要素變量,并基于語義的方法進(jìn)行描述從而建立案件要素變量庫,并且對于每個案件要素定義案件要素變量值;3:對案例庫的裁判文書根據(jù)檢索的案件變量要素的值建立索引;4:對于用戶輸入的案件描述或者導(dǎo)入的審判文書,抽取待檢索文件的案件要素變量的值;5:將待檢索的案件的案件要素變量的值帶入到索引庫中檢索并輸出檢索結(jié)果。本方法提供的相似案例檢索方法能夠滿足非法律專業(yè)用戶的案件檢索需求和盡量找到案情相似的案例,提高檢索效率。
技術(shù)領(lǐng)域
本發(fā)明涉及法律人工智能領(lǐng)域,具體涉及一種基于語義抽取的相似案件檢索方法。
背景技術(shù)
法律行業(yè)的案例檢索并不是新事物,它與其他科學(xué)一樣,始于文字、符號與圖案的產(chǎn)生,并伴隨具體科學(xué)領(lǐng)域的誕生與發(fā)展而不斷深入。隨著信息大爆炸時代的到來以及近年來經(jīng)濟(jì)社會的深刻變革,案例檢索被提高到了前所未有的高度。現(xiàn)有的案例檢索系統(tǒng),包括無訟案例、北大法寶、威科先行等數(shù)據(jù)庫,采用的主要方法是,使用案件的關(guān)鍵詞和關(guān)鍵詞之間的簡單運算符,在法律文本中進(jìn)行檢索。這種方法存在一定的弊端,例如用戶通常不是法律專業(yè),難以選擇正確的關(guān)鍵詞進(jìn)行高效的檢索。例如,要查詢銀行卡被盜刷案件的裁判規(guī)則,如果在北大法寶下“中央法規(guī)司法解釋”和“地方法規(guī)規(guī)章”進(jìn)行檢索,輸入關(guān)鍵詞“銀行卡”、“被盜”或者“銀行卡”、“盜刷”后,沒有得到任何檢索結(jié)果,但是如果輸入“偽卡”、“交易”后,得到21條結(jié)果。另外,隨著社會的發(fā)展用戶接觸到的案件體現(xiàn)出“四多”的特征,即時間多(時間點多、跨度大)、人多(案涉主體多且關(guān)系雜糅)、錢多、事由多(案涉各個節(jié)點的事件性質(zhì)跨度大,從侵權(quán)到違約,不一而足)。關(guān)鍵詞的方法往往難以體現(xiàn)案件的本質(zhì)。
因此需要一種案例檢索方法,一方面能夠滿足非法律專業(yè)用戶的案件檢索需求;另一方面能夠著眼于案件本質(zhì),盡量找到案情相似的案例,提高檢索效率。
發(fā)明內(nèi)容
1、所要解決的技術(shù)問題:
本發(fā)明提供一種基于語義的相似案件檢索方法,本方法對于用戶給出的案件描述或者導(dǎo)入的裁判文書,在裁判文書庫中進(jìn)行檢索,將檢索到的類似案例按照相似程度進(jìn)行排序,并展示給用戶。
2、技術(shù)方案:
一種基于語義抽取的相似案件檢索方法,其特征在于:包括以下步驟:
步驟一:建立案例庫:獲取裁判文書,進(jìn)行預(yù)處理并存儲,形成案例庫。
步驟二:建立案件要素變量庫;法律專家定義裁判文書中可能涉及的所有案件要素變量;并通過語義的方法進(jìn)行描述每個案件要素變量;其中定義每個案件要素變量為案件事實陳述部分或?qū)徟薪Y(jié)構(gòu)部分的關(guān)鍵因素的模式,以及可能的取值范圍;在一個判決書中,每個案件要素變量體現(xiàn)為一個數(shù)值,即案件要素變量的值。每個案件要素變量為案件事實陳述部分或?qū)徟薪Y(jié)構(gòu)部分的關(guān)鍵因素的模式,以及可能的取值范圍。
步驟三:對案例庫的裁判文書建立索引:抽取出案例庫中的每個裁判文書中的案件要素變量的值;根據(jù)檢索出的案件要素變量的值建立裁判文書的倒排索引。
步驟四:抽取待檢索文件的案件要素變量的值:將用戶輸入的案件描述或者導(dǎo)入的審判文書,進(jìn)行預(yù)處理并存儲;抽取待檢索案件的案件要素變量的值。
步驟五:檢索并輸出檢索結(jié)果:將待檢索案件的案件要素變量的值帶入案例庫中進(jìn)行檢索,將檢索到的類似案例按照相似程度進(jìn)行排序,并展示給用戶。
進(jìn)一步地,步驟一還包括:通過網(wǎng)絡(luò)抓取的方式獲得裁判文書或者通過現(xiàn)有的文本案例庫中獲取裁判文書。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京網(wǎng)感至察信息科技有限公司,未經(jīng)南京網(wǎng)感至察信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810311762.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于語義共現(xiàn)模型的概念關(guān)系標(biāo)簽抽取方法
- 一種網(wǎng)頁信息的抽取方法和系統(tǒng)
- 一種基于語義模型的文本信息抽取方法及裝置
- 一種用于含噪稀疏文本的語義關(guān)系抽取方法
- 一種基于改進(jìn)特征融合的語義關(guān)系抽取方法
- 文書的語義標(biāo)簽抽取、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 一種基于組合結(jié)構(gòu)的規(guī)范知識存儲方法
- 一種基于圖像語義分析的自適應(yīng)實踐系統(tǒng)
- 信息抽取方法、抽取模型訓(xùn)練方法、裝置以及電子設(shè)備
- 一種信息抽取方法、裝置及電子設(shè)備





