[發(fā)明專利]一種裁判文書格式化處理方法在審
| 申請?zhí)枺?/td> | 201910698875.6 | 申請日: | 2019-07-31 |
| 公開(公告)號: | CN110599289A | 公開(公告)日: | 2019-12-20 |
| 發(fā)明(設(shè)計(jì))人: | 楊玉東;賀愛英;李英韜;李洪生;張明良;范路佳 | 申請(專利權(quán))人: | 長春市萬易科技有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06Q50/18 |
| 代理公司: | 22214 長春眾邦菁華知識產(chǎn)權(quán)代理有限公司 | 代理人: | 于曉慶 |
| 地址: | 130000 吉林省長春市*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 裁判 格式化處理 格式化數(shù)據(jù) 檢索 自然語言處理技術(shù) 人工智能領(lǐng)域 格式化 類別識別 企業(yè)關(guān)系 企業(yè)數(shù)據(jù) 企業(yè)信用 時間檢索 數(shù)據(jù)存儲 信息核實(shí) 重要數(shù)據(jù) 自動添加 自動形成 文本化 計(jì)算機(jī) 分出 識讀 工作量 公文 關(guān)聯(lián) 應(yīng)用 案件 | ||
一種裁判文書格式化處理方法,涉及計(jì)算機(jī)中人工智能領(lǐng)域,解決了文本化裁判文書自動變成格式化數(shù)據(jù)這一技術(shù)問題。本發(fā)明包括:裁判文書類別識別;標(biāo)題識別;文號識別;時間檢索;案件摘要;被告檢索;原告檢索;數(shù)據(jù)存儲;信息查重;信息核實(shí);企業(yè)數(shù)據(jù)關(guān)聯(lián)。本發(fā)明的特點(diǎn)在于將常規(guī)格式化公文與自然語言處理技術(shù)結(jié)合于一體,應(yīng)用在裁判文書領(lǐng)域中。通過對裁判文書的格式化處理,分出裁判文書的類別、原告、被告、發(fā)生時間等信息,自動形成計(jì)算機(jī)可識讀的格式化數(shù)據(jù),并自動添加到企業(yè)關(guān)系表中,形成了企業(yè)信用的重要數(shù)據(jù),解決了人工格式化處理的工作量問題。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)中人工智能技術(shù)領(lǐng)域,具體涉及一種裁判文書格式化處理方法。
背景技術(shù)
信用是在人們經(jīng)濟(jì)交往過程中產(chǎn)生的,因此,一個國家經(jīng)濟(jì)交往狀況對該國家的信用體系建設(shè)有決定性的影響。近幾年隨著中國的經(jīng)濟(jì)的快速發(fā)展,國家也意識到信用的重要作用,也努力建設(shè)信用體系,力爭加快進(jìn)入信用社會的步伐,但國內(nèi)的信用體系很難做到像歐美那樣,尤其是在信用體系的基礎(chǔ)環(huán)節(jié)- 征信體系方面,更是舉步維艱。
為了建立起我國信用體系的基本框架,國家將培育信用市場主體,大力發(fā)展信用服務(wù)業(yè)作為七大重要對策措施之一。信用服務(wù)企業(yè)通過生產(chǎn)信用報(bào)告、開展信用評級、信用擔(dān)保、商賬追收和信用管理咨詢等信用業(yè)務(wù),為授信單位提供信用風(fēng)險(xiǎn)管理服務(wù),在信用體系中發(fā)揮著市場主體作用。
裁判文書作為判定一個企業(yè)或個人信用的重要組成部分,是對其風(fēng)險(xiǎn)判定的重要參考依據(jù),而裁判文書每天的發(fā)布量大約為幾萬條,這些如果單靠人工進(jìn)行分類整理,不僅需要大量的人力和財(cái)力支持,且長時間重復(fù)工作,造成準(zhǔn)確率急劇下降。
人工智能技術(shù)的發(fā)展,尤其是中文的命名實(shí)體識別技術(shù)的發(fā)展,給通過計(jì)算機(jī)自動識別裁判文書、并對裁判文書進(jìn)行格式化處理提供了技術(shù)可能。
由于裁判文書往往是非結(jié)構(gòu)化信息,不能依靠簡單的結(jié)構(gòu)解析就提取出想要的信息,而是需要自然語言處理技術(shù)來提取出裁判文書中的關(guān)鍵信息。如何采用計(jì)算機(jī)自動將文本化裁判文書變成格式化數(shù)據(jù)是目前亟待解決的重要問題。
發(fā)明內(nèi)容
為了解決文本化裁判文書自動變成格式化數(shù)據(jù)這一技術(shù)問題,本發(fā)明提供一種裁判文書格式化處理方法,屬于一種針對專用公文的自然語言處理方法。
本發(fā)明為解決技術(shù)問題所采用的技術(shù)方案如下:
本發(fā)明的一種裁判文書格式化處理方法,包括以下步驟:
步驟一、裁判文書類別識別;
對裁判文書的類別進(jìn)行維護(hù):刑事案件、民事案件、行政案件、賠償案件、執(zhí)行案件;在采集裁判文書數(shù)據(jù)的過程中,根據(jù)不同的欄目進(jìn)行分類標(biāo)識,刑事案件:CR;民事案件:CI;行政案件:AD;賠償案件:CO;執(zhí)行案件:EX;
步驟二、標(biāo)題識別;
默認(rèn)為單獨(dú)一行“最高人民法院”為標(biāo)題行,其下面一整行內(nèi)容為該裁判文書的類別標(biāo)識;
步驟三、文號識別;
步驟四、時間檢索;
完成發(fā)文日期、案件發(fā)生日期范圍、審理日期范圍的格式化;
步驟五、案件摘要;
步驟六、被告檢索;
步驟七、原告檢索;
步驟八、數(shù)據(jù)存儲;
將步驟一至步驟七所產(chǎn)生的裁判文書分解的數(shù)據(jù)保存到數(shù)據(jù)庫中,并標(biāo)識數(shù)據(jù)來源、采集日期,同時存儲整個裁判文書文件及可疑性判斷;
步驟九、信息查重;
步驟十、信息核實(shí);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于長春市萬易科技有限公司,未經(jīng)長春市萬易科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910698875.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購物或電子商務(wù)
G06Q30-02 .行銷,例如,市場研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎勵;價格評估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購買、出售或租賃交易
G06Q30-08 ..拍賣
- 具有文件恢復(fù)功能的電子設(shè)備及其方法
- 用于使通信點(diǎn)數(shù)據(jù)保持符合規(guī)則的系統(tǒng)
- 用于聯(lián)機(jī)分析處理系統(tǒng)的數(shù)據(jù)格式化裝置和方法
- 就地的盤去格式化
- 一種Java Web項(xiàng)目的表現(xiàn)層數(shù)據(jù)格式化系統(tǒng)
- 一種格式化方法及相關(guān)裝置
- 格式化智能終端的方法及其智能終端、存儲介質(zhì)
- 數(shù)據(jù)格式化方法、裝置、編程系統(tǒng)、設(shè)備及存儲介質(zhì)
- 一種基于人工智能的信息數(shù)據(jù)格式化組件
- 一種基于區(qū)塊鏈的數(shù)據(jù)安全保護(hù)方法、存儲介質(zhì)





