[發明專利]一種基于語義抽取的相似案件檢索方法在審
| 申請號: | 201810311762.1 | 申請日: | 2018-04-09 |
| 公開(公告)號: | CN108595547A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 孟濤;李佳靜 | 申請(專利權)人: | 南京網感至察信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q50/18 |
| 代理公司: | 南京源古知識產權代理事務所(普通合伙) 32300 | 代理人: | 馬曉輝 |
| 地址: | 210001 江蘇省南京市秦淮區光華*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 案件 案件檢索 檢索 語義抽取 案例庫 裁判 語義 案例檢索 法律專業 檢索結果 檢索文件 檢索效率 建立索引 要素定義 專家定義 變量庫 索引庫 抽取 輸出 法律 | ||
1.一種基于語義抽取的相似案件檢索方法,其特征在于:包括以下步驟:
步驟一:建立案例庫:獲取裁判文書,進行預處理并存儲,形成案例庫;
步驟二:建立案件要素變量庫;法律專家定義裁判文書中可能涉及的所有案件要素變量;并通過語義的方法進行描述每個案件要素變量;其中定義每個案件要素變量為案件事實陳述部分或審判結構部分的關鍵因素的模式,以及可能的取值范圍;在一個判決書中,每個案件要素變量體現為一個數值,即案件要素變量的值;
步驟三:對案例庫的裁判文書建立索引:抽取出案例庫中的每個裁判文書中的案件要素變量的值;根據檢索出的案件要素變量的值建立裁判文書的倒排索引,建立索引庫;
步驟四:抽取待檢索文件的案件要素變量的值:將用戶輸入的案件描述或者導入的審判文書,進行預處理并存儲;抽取待檢索案件的案件要素變量的值;
步驟五:檢索并輸出檢索結果:將待檢索案件的案件要素變量的值帶入案例庫中進行檢索,將檢索到的類似案例按照相似程度進行排序,并展示給用戶。
2.根據權利要求1所述的一種基于語義抽取的相似案件檢索方法,其特征在于:步驟一還包括:通過網絡抓取的方式獲得裁判文書或者通過現有的文本案例庫中獲取裁判文書。
3.根據權利要求1所述的一種基于語義抽取的相似案件檢索方法,其特征在于:步驟二中案件要素變量的語義描述的方法為基于TML語言實現;具體為:在TML中,案件要素定義為概念或概念關系,待抽取的概念和概念關系以非終結符形式體現在方法中,字符串、正則表達式和計算符號以終結符形式體現;并且,TML中的計算符號包括AND,OR,NOT,SENT,DIST_n,ORD;所述TML語言用來表示復雜的語義結構。
4.根據權利要求1所述的一種基于語義抽取的相似案件檢索方法,其特征在于:步驟三還包括根據抽取得到的案件要素變量的值,建立裁判文書的倒排索引時同時生成每個裁判文書的案件要素向量。
5.根據權利要求1所述的一種基于語義抽取的相似案件檢索方法,其特征在于:所述案件要素向量為:在案件文書中抽取出的對于法律專家定義的N種案件要素,根據每個抽取得到的案件要素的變量值,建立文書的案件要素向量V為:V(d)=((t1,w1),(t2,w2)…,(tn,wN)),其中ti為文書d中第i個案件要素變量的值,wi為第i個案件要素變量的權重,取值為1或者根據經驗設置。
6.根據權利要求1所述的一種基于語義抽取的相似案件檢索方法,其特征在于:步驟四還包括用戶輸入的案件描述或者導入的審判文書,抽取案件要素變量的值時生成待檢索文件的檢索案件要素向量。
7.根據權利要求1所述的一種基于語義抽取的相似案件檢索方法,其特征在于:步驟五具體過程為首先根據案件要素變量的值,在案例庫中檢出相關裁判文書;然后計算待檢索文件的案件要素向量與所述相關裁判文書的案件要素向量的相似度;按照相似度排序輸出類似案件,并展示給用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京網感至察信息科技有限公司,未經南京網感至察信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810311762.1/1.html,轉載請聲明來源鉆瓜專利網。





