[發(fā)明專利]一種基于案件相似度匹配的審判風(fēng)險預(yù)警方法在審
| 申請?zhí)枺?/td> | 202010473652.2 | 申請日: | 2020-05-29 |
| 公開(公告)號: | CN111709236A | 公開(公告)日: | 2020-09-25 |
| 發(fā)明(設(shè)計)人: | 周凡;林格;陳小燕;林謀廣 | 申請(專利權(quán))人: | 中山大學(xué) |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/284;G06F40/216;G06K9/62;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510006 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 案件 相似 匹配 審判 風(fēng)險 預(yù)警 方法 | ||
1.一種基于案件相似度匹配的審判風(fēng)險預(yù)警方法,其特征在于,所述方法包括:
步驟一:從法律判決書信息管理系統(tǒng)中獲取近3年來的法院判決書,使用關(guān)鍵詞匹配的方法,提取出對應(yīng)的案件描述、裁決結(jié)果。
步驟二:對提取的案件數(shù)據(jù)進行文本的預(yù)處理,得到案件文本的訓(xùn)練語料。
步驟三:運用word2vec方法對預(yù)處理生成的案件文本語料進行詞向量的訓(xùn)練,對每一個出現(xiàn)在語料中的單詞都得到一個詞向量,每個詞向量具有d的維度。
步驟四:在使用關(guān)鍵詞匹配抽取得到的案件描述、判決結(jié)果中分別抽取k1和k2個高頻詞語作為本篇判決書的關(guān)鍵詞,分別計算其TF-IDF詞頻,并取出其訓(xùn)練得到后的向量組,計算得到加權(quán)平均向量。此時第i篇判決書由兩個維度為d的向量表示,分別是案件描述向量和判決結(jié)果向量。
步驟五:從數(shù)據(jù)庫系統(tǒng)中提取出當前案件的案件描述和判決結(jié)果,按照步驟一至步驟四進行處理,從而獲取當前的案件判決書的案件描述向量和判決結(jié)果向量。
步驟六:將步驟五獲得的當前案件描述向量與步驟四中獲得的歷史案件描述向量進行矩陣點乘,計算當前判決書與數(shù)據(jù)庫中每一個判決書的案件描述相似度。
步驟七:將步驟六獲取的文本相似度進行排序,選取相似度較高的M個案件,找到其判決結(jié)果向量。
步驟八:對步驟七獲得的M個案件的判決結(jié)果向量,與當前案件的判決結(jié)果向量進行點乘,得到不同案件判決結(jié)果的相似度。
步驟九:計算步驟八獲得的當前案件與歷史案件的判決結(jié)果相似度的平均值,即該案件當前判決結(jié)果的風(fēng)險值,當此值低于閾值時,系統(tǒng)啟動風(fēng)險預(yù)警。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010473652.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





