[發(fā)明專利]一種裁判文書質(zhì)量評測的方法和裝置有效
| 申請?zhí)枺?/td> | 202110163510.0 | 申請日: | 2021-02-05 |
| 公開(公告)號: | CN113378542B | 公開(公告)日: | 2022-04-01 |
| 發(fā)明(設(shè)計)人: | 楊哲;艾中良;李燦;賈高峰 | 申請(專利權(quán))人: | 中國司法大數(shù)據(jù)研究院有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/295;G06F40/284;G06F40/289;G06F16/35;G06N3/04;G06Q10/06;G06Q50/18 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100070 北京市豐臺區(qū)南四*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 裁判 文書 質(zhì)量 評測 方法 裝置 | ||
1.一種裁判文書質(zhì)量評測的方法,其特征在于,包括以下步驟:
錄入待評測的目標(biāo)裁判文書;
對目標(biāo)裁判文書進行解析;
對解析得到的內(nèi)容進行指標(biāo)分析,所述指標(biāo)分析包括錯別字篩查、格式完整性分析、內(nèi)容規(guī)范性分析、法條援引準(zhǔn)確性分析、內(nèi)容邏輯性分析;
根據(jù)指標(biāo)分析的結(jié)果進行指標(biāo)項得分計算;
根據(jù)各指標(biāo)項得分計算目標(biāo)裁判文書的質(zhì)量的綜合評測得分;
所述錯別字篩查,包括以下步驟:
1)利用分詞器對目標(biāo)文書S進行分詞,分詞后得到的文書元素記為Si;
2)計算文書元素Si的上下文語境的搭配關(guān)聯(lián)度T;搭配關(guān)聯(lián)度T的計算方法是:
其中,TL和TR分別代表元素Si與上文的左關(guān)聯(lián)度和與下文的右關(guān)聯(lián)度;表示元素Si和上文語境(S1,S2,S3,...,Si-1)組合在語境中出現(xiàn)的概率表示元素Si和下文語境(Si+1,Si+2,Si+3,...,Sn)組合在語境中出現(xiàn)的概率Kmax為詞匯組合出現(xiàn)概率的最大值;
3)對搭配關(guān)聯(lián)度T低于閾值的元素,利用詞向量得出與元素Si的語義最接近的詞S'并將其放入原始的語境中,再次計算其搭配關(guān)聯(lián)度T';
4)計算Si所在上下文語境的概率根據(jù)條件概率公式,Si所在上下文語境的概率的計算方法是:
其中,Si-M、Si+M分別表示與當(dāng)前詞Si前后距離為M的詞;
5)運用綜合搭配關(guān)聯(lián)度和概率的錯別字檢測函數(shù)來判斷評論中是否含有錯別字,的計算公式如下:
其中,λ1、λ2表示搭配關(guān)聯(lián)度和概率所占比重,0λ11,0λ21。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述錄入待評測的目標(biāo)裁判文書,包括:上傳裁判文書;或者根據(jù)輸入的案號自動獲取對應(yīng)的裁判文書。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對目標(biāo)裁判文書進行解析,包括:采用規(guī)則識別結(jié)合機器學(xué)習(xí)模型識別的方式分別解析出基本信息、當(dāng)事人信息、審理經(jīng)過、訴辯稱內(nèi)容、本院認(rèn)為內(nèi)容、裁判結(jié)果內(nèi)容。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述格式完整性分析和所述內(nèi)容規(guī)范性分析,采用命名實體識別技術(shù)結(jié)合預(yù)設(shè)規(guī)則的方法,對目標(biāo)裁判文書的格式和基本信息、當(dāng)事人信息、審理經(jīng)過、訴辯稱內(nèi)容、本院認(rèn)為內(nèi)容、裁判結(jié)果內(nèi)容進行格式完整性和內(nèi)容規(guī)范性檢查;所述法條援引準(zhǔn)確性分析,采用Text-CNN模型建立法條檢測模型,首先對目標(biāo)裁判文書進行分詞處理后,利用skip-gram模型訓(xùn)練詞向量,然后利用Text-CNN模型進行法條援引準(zhǔn)確性檢測;所述內(nèi)容邏輯性分析,采用在語境中的上下文語境搭配關(guān)聯(lián)度T,若該T的值小于設(shè)定閾值,則標(biāo)記為邏輯問題文本。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)指標(biāo)分析的結(jié)果進行指標(biāo)項得分計算,包括:獲取各指標(biāo)項的打分?jǐn)?shù)據(jù),根據(jù)各指標(biāo)項的計算處理邏輯,對各指標(biāo)項進行計算處理,得到目標(biāo)裁判文書的五個指標(biāo)項的得分。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各指標(biāo)項得分計算目標(biāo)裁判文書的質(zhì)量的綜合評測得分,包括:通過大數(shù)據(jù)挖掘分析及結(jié)合專家經(jīng)驗,建立裁判文書質(zhì)量評測綜合得分計算模型,根據(jù)裁判文書質(zhì)量評測綜合得分計算模型,計算目標(biāo)裁判文書的綜合評測得分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國司法大數(shù)據(jù)研究院有限公司,未經(jīng)中國司法大數(shù)據(jù)研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110163510.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





