[發明專利]一種裁判文書精準化數據歸類分析方法及計算機可以讀取的存儲裝置有效
| 申請號: | 202110677488.1 | 申請日: | 2021-06-18 |
| 公開(公告)號: | CN113239206B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 王燕玲 | 申請(專利權)人: | 廣東博維創遠科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/242;G06F40/247;G06F40/30;G06F16/215;G06F16/23;G06F16/27;G06Q50/18 |
| 代理公司: | 佛山高業知識產權代理事務所(普通合伙) 44562 | 代理人: | 李貴梅 |
| 地址: | 528000 廣東省佛山市順德區樂從鎮樂從社*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 裁判 文書 精準 數據 歸類 分析 方法 計算機 可以 讀取 存儲 裝置 | ||
本發明涉及一種裁判文書精準化數據歸類分析方法及計算機可以讀取的存儲裝置,包括一種存儲裝置以及所處理的如下步驟,A)建立法律關系分類詞庫;B)識別電子標簽;C)裁判文書的字段提取與電子標簽歸類;D)用戶選擇性校正,將修正邏輯反饋至法律關系分類詞庫;E)輸出與數據直接相關的用戶自定義圖表或直接相關的多元線性分析結果。本發明可以建立在億級數量的全量裁判文書數據庫之上,數據準確度高,接入靈活,并且電子標簽的標注與校正依照NLP深度學習,提高了打標的準確度,同時,還可以幫助用戶明白數據背后的關聯和含義。
技術領域
本發明涉及的是文本分類分析技術領域,具體來說,涉及的是一種裁判文書精準化數據歸類分析方法及計算機可以讀取的存儲裝置。
背景技術
裁判文書是包含判決書、裁定書、調解書、決定書等多種類型的由人民法院依法作出的具有法律意義的文書的統稱,而裁判文書的內容具有時代以及地區意義,是隨著發展而不斷更新自身內容的表達形式,是一種不斷變化不斷升級的文書體裁,對于裁判文書的研究,有助于理解法制社會的發展脈絡,從而找出不同時期不同場合下執法尺度相關的變化情況。
而現有的裁判文書錄入系統,對于語言不斷變化的現代漢語來說,在把握裁判文書的不同關鍵字段的特點方面仍然精確度較佳,尤其是多種可以被認為是同一含義的不同詞匯,在拾取精度上尚達不到較佳效果,同時,不能很好地根據不同類別的字段建立一目了然的數據表格,并將數據輸出成更加直觀且能夠看出執法尺度變化規律的表格文字形式,因此,不利于執法人員對自身業務水平的提高以及法治社會的健全快速發展。
現有技術中,存在有諸如面向裁判文書的文本信息抽取方法、基于信息提取的裁判文書分類方法、裁判文書結構化處理方法及系統的相關方案,上述的技術方案中均對于提高信息提取精度以及歸納作出了設想以及解釋說明,但是,對于字段信息及其關聯的數據數值沒有一個很好的整理和總結,尤其是不能讓查詢者很好地完成快速準確地裁判文書錄入及后續的資訊分類分析操作,因此仍有值得改進的方面。
發明內容
針對背景技術中存在的技術缺陷,本發明提出一種裁判文書精準化數據歸類分析方法及計算機可以讀取的存儲裝置,解決了上述技術問題以及滿足了實際需求,具體的技術方案如下所示:
一種裁判文書精準化數據歸類分析方法,包括如下處理步驟,
A)裁判文書數據庫基于NLP學習或手動錄入建立裁判文書的多字段歸類的法律關系分類詞庫;
B)法律關系分類詞庫將錄入的歸類后多字段識別為電子標簽;
C)依照電子標簽對電子錄入或轉成電子形式錄入的裁判文書進行匹配的字段提取,同時,對與現有電子標簽近似但不吻合的字段進行提取,并歸類到近似的電子標簽中;
D)將提取完字段的裁判文書重新展示于顯示媒介,由用戶進行選擇性校正,將校正后的字段匹配至用戶設定的電子標簽,一并錄入裁判文書數據庫,同時,將校正后的電子標簽與被校正字段建立修正邏輯反饋至法律關系分類詞庫;
E)根據裁判文書所匹配的電子標簽,輸出與數據直接相關的用戶自定義圖表,且該用戶自定義圖表須關聯所依托數據類型以及數值大小,輸出由數據類型與其數值大小捆綁輸出的文字性直接敘述或通過同一電子標簽下的數值大小直接相關的多元線性分析結果,由用戶選擇性展示。
本發明較優的方案之一,所述步驟A中,手動錄入為單人本地錄入、單人異地錄入、多人本地錄入以及多人異地錄入,其中,法律關系分類詞庫在錄入過程中,識別用戶錄入的第一個非庫內已有電子標簽字符后,觸發自動保存進度并同步云端,或者是每隔固定時間觸發自動保存進度并同步云端。
本發明較優的方案之一,所述步驟B中,法律關系分類詞庫識別的多字段,按照以下級別遞增的依據優先度對法律關系分類詞庫的電子標簽進行逐級匹配,以先匹配到的為準,依據同步到云端的最新用戶自定義電子標簽、司法文書規則中的同義詞或近義詞、中國漢語詞典最新版的同義詞或近義詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東博維創遠科技有限公司,未經廣東博維創遠科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110677488.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





