[發明專利]法律文書的特征提取方法、相關裝置及存儲介質在審
| 申請號: | 201910936787.5 | 申請日: | 2019-09-29 |
| 公開(公告)號: | CN110765889A | 公開(公告)日: | 2020-02-07 |
| 發明(設計)人: | 何芳芳;邵博 | 申請(專利權)人: | 平安直通咨詢有限公司上海分公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06F40/295;G06F40/30;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 44414 深圳中一聯合知識產權代理有限公司 | 代理人: | 劉永康 |
| 地址: | 200040 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征提取模型 法律 存儲介質 特征提取 相關裝置 輸出 | ||
一種法律文書的特征提取方法、相關裝置及存儲介質,其中,對法律文書進行預識別,確定所述法律文書對應的段落劃分模型和特征提取模型;其中,所述特征提取模型包括有文書段落與文書要素的對應關系;通過所述段落劃分模型對所述法律文書進行文書段落劃分;通過所述特征提取模型從文書段落劃分后的法律文書中提取與所述文書段落對應的文書要素,并輸出所述文書要素的提取結果。
技術領域
本申請涉及電子技術領域,尤其涉及一種法律文書的特征提取方法、相關裝置及存儲介質。
背景技術
隨著我國法律體系的不斷完善,大家的維權意識日益提高,法律服務在日常生活中起著舉足輕重的地位,法律服務是社會各行各業中重要的一個必備組成部分,各種互聯網+法律平臺如雨后春筍般創立并上線運營。但是,法律服務作為一種具有較強個性化、專業化的行業,對互聯網+具有更高的要求。
法律文書包含豐富的法律概念和法理邏輯。通過對其解構,能夠協助用戶迅速掌握案請要素。
在現有技術中,法律文書解構,解構后的要素簡單,只能實現簡單的文書類型歸類,缺少完整的法理邏輯,難以提供有效的案情梳理信息。
發明內容
本申請實施例提供一種法律文書的特征提取方法、電子裝置及計算機可讀存儲介質,用于對法律文書進行具體的文書要素的內容解構。
本申請實施例第一方面提供的一種法律文書的特征提取方法,包括:
對法律文書進行預識別,確定所述法律文書對應的段落劃分模型和特征提取模型;其中,所述特征提取模型包括有文書段落與文書要素的對應關系;
通過所述段落劃分模型對所述法律文書進行文書段落劃分;
通過所述特征提取模型從文書段落劃分后的法律文書中提取與所述文書段落對應的文書要素,并輸出所述文書要素的提取結果。
在本申請實施例的一種實施方式中,所述對法律文書進行預識別之前,還包括:
對所述法律文書進行預處理,所述預處理包括以下至少一項:
異常換行處理,中文金額處理,中文數字轉阿拉伯數字,標點格式統一,非法字符替換以及錯別字處理。
在本申請實施例的一種實施方式中,所述對法律文書進行預識別,確定所述法律文書對應的段落劃分模型和特征提取模型,包括:
識別所述法律文書的文書標題;
根據所述文書標題確定所述法律文書對應的文書類型;
確定所述文書類型對應的段落劃分模型,以及所述段落劃分模型對應的特征提取模型。
在本申請實施例的一種實施方式中,所述通過所述特征提取模型對文書段落劃分后的法律文書進行文書要素的提取,包括:
獲取對所述法律文書進行段落劃分后的文書段落,將所述文書段落作為所述特征提取模型的輸入對象;所述特征提取模型中包括多個文書要素規則。
根據標點符號對所述文書段落進行斷句,切割得到的多個句子形成句子序列;
根據所述段落劃分后的文書段落,在所述特征提取模型中篩選所述文書段落對應的文書要素規則;
按照所述句子序列依次逐一讀取句子,并對讀入的句子使用所述文書段落對應的文書要素規則進行特征匹配;當匹配成功一個文書要素規則之后,輸出相應的文書要素,并進行下一個句子的匹配,直至所述句子序列中的所有句子都完成匹配。
在本申請實施例的一種實施方式中,所述特征提取模型包括:TextCNN網絡,TextRNN網絡和TextRCNN網絡;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安直通咨詢有限公司上海分公司,未經平安直通咨詢有限公司上海分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910936787.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:指紋識別顯示模組及其控制方法
- 下一篇:工程圖紙識別方法、電子設備及相關產品





