[發明專利]一種法院案件卷宗識別方法有效
| 申請號: | 202110543832.8 | 申請日: | 2021-05-19 |
| 公開(公告)號: | CN113239681B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 姜森;謝紹韞 | 申請(專利權)人: | 蘇州黑云智能科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/30;G06F40/103;G06K9/62;G06Q50/18 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 葉丙靜 |
| 地址: | 215000 江蘇省蘇州市中國(江蘇)自由貿易試驗區*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 法院 案件 卷宗 識別 方法 | ||
本發明涉及一種法院案件卷宗識別方法,屬于自然語言處理技術領域。該方法基于案情全文進行罪名分析和特征要素提取,提取案件要素,輔助法院工作人員分析案件,具體包括以下步驟:S1:采用基于規則的方法和相似度模型的方法對案件罪名進行分析;S2:構建語料庫和規則庫;S3:基于語義和句式規則進行段落劃分;S4:采用基于規則的方法和基于實體識別的方法對案件中的關鍵特征要素進行提取;S5:規范數據格式;S6:展示分析結果。本發明提供的方法詳細地分析和展示了判決書復雜案情中用戶關注的信息數據,顯著地提高了分析結果的細化度和準確率,有效地提升了法院工作人員分析案件的效率。
技術領域
本發明屬于自然語言處理技術領域,涉及一種法院案件卷宗識別方法。
背景技術
隨著信息化時代的迅速發展以及人民法律意識的快速提升,法院需要處理的各類刑事案件判決文書數量和質量呈快速的增長和提升,如何提高法院分析判決文書的工作效率成為了一個亟需解決的問題。在過去,對于待處理的判決文書,法院一般基于法律專家對判決文書進行研讀分析,案件文檔處理效率低下,很難快速地建立各案件完整規范的案件要素結構,且分析過程常常需要耗費大量的人力精力,很大程度上影響法院的案件處理效率。因此,我們需要尋求一種技術,在法院分析案件時,協助法院工作人員快速地自動化分析判決文書,智能地將刑事案件特征要素提取出來,清晰地將分析結果展示給用戶。
目前,在法院智能化領域,針對司法判決書數據的應用主要使用兩類技術,分別是基于規則的司法判決書信息抽取技術和基于搜索引擎的類案檢索技術。技術相關應用均集中在對司法判決書的簡單檢索,以及對司法判決書中部分數據的精確抽取工作上,未能充分考慮到司法判決書的信息冗余和表達方式多樣的特性,不具備對部分案情信息的精確抽取能力,難以滿足面向司法判決書數據的后續分析需求。
發明內容
有鑒于此,本發明的目的在于提供一種法院案件卷宗識別方法。協助法院工作人員對刑事案件判決文書進行快速分析,通過自然語言處理技術與Web開發技術相結合,精準地對判決文書中的案情信息進行提取分析,并通過清晰的頁面展示功能直觀地反饋給用戶,從而滿足各類司法場景中快速分析判決文書案情信息的需求,大幅度地提高法院工作效率,為法院工作人員提供優質的服務。
為達到上述目的,本發明提供如下技術方案:
一種法院案件卷宗識別方法,該方法基于案情全文進行罪名分析和特征要素提取,提取案件要素,輔助法院工作人員分析案件,具體包括以下步驟:
S1:采用基于規則的方法和相似度模型的方法對案件罪名進行分析;
相似度模型的方法是指根據word2vec余弦相似度,判斷兩個文章或者句子相似程度的算法。根據向量坐標,繪制在空間中,求得夾角的cos值。Cos值越接近1,則說明夾角越小,即兩向量相似。
S2:構建語料庫和規則庫;
S3:基于語義和句式規則進行段落劃分;
S4:采用基于規則的方法和基于實體識別的方法對案件中的關鍵特征要素進行提取;
S5:規范數據格式;
S6:展示分析結果。
可選的,所述S1中,基于規則的方法為構建罪名句式規則庫,通過正則表達式提取與規則庫相匹配的罪名數據;
若提取失效,未從判決書中提取到罪名數據,則采用基于word2vec相似度模型的方式;
該方式首先基于大量的同案判決書文檔,訓練同案罪名的語料庫模型,然后基于訓練好的模型來對新的待處理文檔進行罪名分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州黑云智能科技有限公司,未經蘇州黑云智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110543832.8/2.html,轉載請聲明來源鉆瓜專利網。





