[發明專利]一種基于圖的裁判文書案件相似計算與檢索方法及系統有效
| 申請號: | 201711033582.3 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN108038091B | 公開(公告)日: | 2021-12-14 |
| 發明(設計)人: | 金耀輝;姜華;李慧;王永坤 | 申請(專利權)人: | 上海思賢信息技術股份有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F16/332 |
| 代理公司: | 上海旭誠知識產權代理有限公司 31220 | 代理人: | 鄭立 |
| 地址: | 201207 上海市浦東新區自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 裁判 文書 案件 相似 計算 檢索 方法 系統 | ||
本發明公開了一種基于圖的裁判文書案件相似計算與檢索方法,包括以下主要步驟:1、采集裁判文書;2、識別裁判文書的說理部分;3、解析說理部分的案件要素;4、生成案件事理圖譜;5、客戶端接收檢索信息;6、抽取或映射案件要素;7、匹配計算案件要素事理圖譜;8、返回與檢索內容相似的案件。同時公開了一種基于圖的裁判文書案件相似計算與檢索系統,其特征在于,包括裁判文書案件相似計算裝置和相似案件文書檢索裝置。本發明提出的方法和系統充分考慮了裁判文書的專業知識,生成的案件事理圖譜以一種壓縮但直觀的方式表示出了案件的最關鍵要素和內在邏輯關系,既方便相關人士直觀查看案件要點,也可以精確地從文檔庫中檢索相關的案件。
技術領域
本發明涉及本發明涉及數據處理技術領域,尤其涉及裁判文書案件相似計算與檢索方法和系統。
背景技術
相似案件檢索是利用大數據技術,對公開的裁判文書做挖掘分析,為辦案法官、當事人、律師推送直接相關的指導性或參考性的相似案例。精準高效的相似案件檢索將極大提高辦案質量與效率,讓公眾感受到公平正義。
現有技術中,通常使用關鍵詞或關鍵詞組合的匹配來檢索相似裁判文書,同時結合預設條件如案由、法院名稱、審判程序、裁判日期等對檢索結果進行過濾。關鍵詞檢索如果采用精確匹配,則匹配案件很少;如果采用包含同義詞、近義詞等的關鍵詞,則可能導致匹配案件過多,搜索精度下降。關鍵詞檢索忽略了法律專業領域知識,沒有體現司法邏輯。
在中國專利CN106502996A中提出了一種基于詞頻-單詞反比頻率(TF-IDF)的語義匹配裁判文書檢索方法,通過調整詞在文檔和整個文本集中的權重來提高檢索結果的相關度,優點是非常簡單高效。但是缺點也非常明顯:它對法律文書這類長文本術語的支持不好,并且重要司法邏輯沒有被反映出來,因此檢索結果精度不高。
在中國專利CN106933787A中提出了一種計算裁判文書相似度的方法,首先提取每篇文書的判決關鍵詞,然后構造判決關鍵詞向量,最后通過計算向量的相似度得到裁判文書的相似度。該方法僅考慮了裁判文書的判決結果部分,忽略了裁判文書中證據、事實、爭議焦點、因果關系、適用法條等關鍵的司法邏輯部分,因此案件相似度計算和檢索很難達到司法實務要求。
在中國專利CN105930473A中提出了一種基于隨機森林技術的相似文件檢索方法,通過構造案件特征樹,采用隨機森林技術訓練,得到特征權重樹,根據查詢條件生成兩兩案件的相似度矩陣。該方法高度依賴于精準的案件特征提取,專利并未涉及,可以看作只是現有案由檢索的一種細化。而且在實際案件審判過程中,案件特征往往是交織的,用樹的形式很難表達。
因此,本領域的技術人員致力于開發一種基于圖的裁判文書案件相似計算、檢索方法與系統,從而解決現有方法中忽略法律專業知識和司法邏輯而導致的搜索結果精度低的問題。
發明內容
為解決上述技術問題,本發明提供了一種基于圖的裁判文書案件相似計算與檢索方法,其主要步驟包括:
步驟1、服務器端采集裁判文書;
步驟2、裁判文書的說理部分識別;
進一步地,識別過程主要闡明針對當事人的訴訟請求,根據認定的案件事實,依照法律規定,明確訴請是否支持、部分支持或不予支持。該說理部分的特征是以“本院認為”或類似短語為開始,以“本院予以支持/不予支持”或類似短語為結束;
步驟3、說理部分的案件要素解析;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海思賢信息技術股份有限公司,未經上海思賢信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711033582.3/2.html,轉載請聲明來源鉆瓜專利網。





