[發(fā)明專利]一種基于案件相似度匹配的審判風(fēng)險(xiǎn)預(yù)警方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010473652.2 | 申請(qǐng)日: | 2020-05-29 |
| 公開(公告)號(hào): | CN111709236A | 公開(公告)日: | 2020-09-25 |
| 發(fā)明(設(shè)計(jì))人: | 周凡;林格;陳小燕;林謀廣 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | G06F40/289 | 分類號(hào): | G06F40/289;G06F40/284;G06F40/216;G06K9/62;G06Q50/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510006 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 案件 相似 匹配 審判 風(fēng)險(xiǎn) 預(yù)警 方法 | ||
本發(fā)明公開了一種基于案件相似度匹配的審判風(fēng)險(xiǎn)預(yù)警方法。本發(fā)明對(duì)法律文本進(jìn)行word2vec詞向量嵌入,并將關(guān)鍵詞用詞向量進(jìn)行表示,使用余弦相似度來計(jì)算不同案件之間的相似度。當(dāng)獲得與案件相關(guān)聯(lián)的多種案件之后,基于關(guān)鍵詞抽取的技術(shù)找出其判決結(jié)果,智能化給出本案件合理的判決結(jié)果范圍,當(dāng)實(shí)際判決結(jié)果與推薦判決范圍差別過大時(shí)及時(shí)進(jìn)行智能預(yù)警。本發(fā)明使用了一種基于自然語(yǔ)言理解的類案提取和風(fēng)險(xiǎn)預(yù)警技術(shù),拓展了類案提取的廣度;使用了人工智能中的自然語(yǔ)言理解方法,可提取出更具有深層語(yǔ)義的案件;在風(fēng)險(xiǎn)預(yù)警方面,大大減輕了人力負(fù)擔(dān),充分挖掘了歷史電子案宗和判決結(jié)果之間的聯(lián)系信息,使得法官判決時(shí)具有更便捷的參考。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)及自然語(yǔ)言處理領(lǐng)域,具體涉及一種基于案件相似度匹配的審判風(fēng)險(xiǎn)預(yù)警方法。
背景技術(shù)
在大數(shù)據(jù)時(shí)代,人工智能在各個(gè)行業(yè)都有著廣泛的應(yīng)用。在智慧法院建設(shè)方面,全面推進(jìn)移動(dòng)電子訴訟,推廣量刑輔助、風(fēng)險(xiǎn)預(yù)警等智能輔助系統(tǒng)可以切實(shí)減輕審判法院事務(wù)性工作負(fù)擔(dān),幫助法官提升辦案效率和判決質(zhì)量,以信息化手段推進(jìn)審判、執(zhí)行、服務(wù)智能化。通過充分利用人工智能技術(shù)對(duì)法律文本、過往判例、電子案宗進(jìn)行分析、處理、歸類,當(dāng)法官判決結(jié)果與系統(tǒng)對(duì)過往相似案例的評(píng)估結(jié)果差異較大時(shí)自動(dòng)進(jìn)行風(fēng)險(xiǎn)預(yù)警。通過這些智能輔助類系統(tǒng)可以有效減少“同案不同判”的現(xiàn)象的發(fā)生。
現(xiàn)有的技術(shù)之一為目前的法院智能化系統(tǒng),采用關(guān)鍵詞匹配技術(shù)的類案推送,人力進(jìn)行分析和比對(duì),通過討論降低“同案不同判”的風(fēng)險(xiǎn)。其流程具體如下:
1、將紙質(zhì)卷宗整理后,在高清晰度的掃描后生成電子卷宗,并將其存入數(shù)據(jù)庫(kù)中。這一過程常需要法官人員對(duì)卷宗進(jìn)行關(guān)鍵詞、類別標(biāo)注。
2、對(duì)該電子卷宗進(jìn)行掃描,并生成電子卷宗,在現(xiàn)有的數(shù)據(jù)庫(kù)中找出具有相同關(guān)鍵詞的判決案件,將對(duì)應(yīng)的關(guān)鍵詞相連接的法律法規(guī)同時(shí)檢索出來,并將其向法官推送。
3、法官對(duì)相關(guān)的案件和法規(guī)進(jìn)行人工查閱,進(jìn)而得出具有一定參考性的判決,并由人工進(jìn)行評(píng)議討論,討論該判決是否合理。
該技術(shù)的缺點(diǎn)是:
1、只能進(jìn)行簡(jiǎn)單的文本匹配搜索,不能自動(dòng)對(duì)語(yǔ)義上近似的文本進(jìn)行檢索。
2、人工查閱、篩選參考資料的方式效率較低,需要花費(fèi)法官大量的時(shí)間進(jìn)行進(jìn)一步的討論。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有方法的不足,提出了一種基于案件相似度匹配的審判風(fēng)險(xiǎn)預(yù)警方法。本發(fā)明解決的主要問題有兩個(gè):一是如何基于自然語(yǔ)言理解的技術(shù)找出與當(dāng)前審判案件相近的歷史案宗,使得系統(tǒng)可以按照案件相關(guān)性精準(zhǔn)檢索出海量的歷史案宗。其中主要的技術(shù)難點(diǎn)是如何充分理解案件信息背后的自然語(yǔ)義,克服關(guān)鍵詞匹配的局限性。二是如何針對(duì)不同的歷史案件的判決結(jié)果進(jìn)行篩選,并根據(jù)歷史案件計(jì)算出當(dāng)前案件判決結(jié)果的合理范圍。
為了解決上述問題,本發(fā)明提出了一種基于案件相似度匹配的審判風(fēng)險(xiǎn)預(yù)警方法,所述方法包括:
步驟一:從法律判決書信息管理系統(tǒng)中獲取近3年來的法院判決書,使用關(guān)鍵詞匹配的方法,提取出對(duì)應(yīng)的案件描述、裁決結(jié)果。
步驟二:對(duì)提取的案件數(shù)據(jù)進(jìn)行文本的預(yù)處理,得到案件文本的訓(xùn)練語(yǔ)料。預(yù)處理的操作包括,對(duì)其進(jìn)行分詞,過濾停留詞、人名、地名、時(shí)間等特殊詞語(yǔ),并只保留過濾現(xiàn)頻率過低的詞語(yǔ)等。
步驟三:運(yùn)用word2vec方法對(duì)預(yù)處理生成的案件文本語(yǔ)料進(jìn)行詞向量的訓(xùn)練,對(duì)每一個(gè)出現(xiàn)在語(yǔ)料中的單詞都得到一個(gè)詞向量,每個(gè)詞向量具有d的維度。
步驟四:在使用關(guān)鍵詞匹配抽取得到的案件描述、判決結(jié)果中分別抽取k1和k2個(gè)高頻詞語(yǔ)作為本篇判決書的關(guān)鍵詞,分別計(jì)算其TF-IDF詞頻,并取出其訓(xùn)練得到后的向量組,計(jì)算得到加權(quán)平均向量。此時(shí)第i篇判決書由兩個(gè)維度為d的向量表示,分別是案件描述向量和判決結(jié)果向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010473652.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基于案件信息的案件線索分析系統(tǒng)及方法
- 案件信息動(dòng)態(tài)導(dǎo)入方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種案件自動(dòng)授權(quán)方法及系統(tǒng)
- 獲取法律案件的審理期限的方法及裝置
- 數(shù)據(jù)聚類識(shí)別方法、裝置、計(jì)算機(jī)系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 案件串并方法及裝置
- 案件預(yù)判結(jié)果生成方法、裝置、電子設(shè)備
- 一種公安案件管理系統(tǒng)及方法
- 一種案件分配方法、裝置、設(shè)備及介質(zhì)
- 基于案件預(yù)測(cè)價(jià)值和專員畫像的智能分案方法
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)





