[發明專利]一種實現司法文書中要素識別的方法及裝置有效
| 申請號: | 201811497428.6 | 申請日: | 2018-12-07 |
| 公開(公告)號: | CN111291570B | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 趙耀;陳春磊 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06K9/62;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 柳欣;王寶筠 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實現 司法 文書 要素 識別 方法 裝置 | ||
1.一種實現司法文書中要素識別的方法,其特征在于,所述方法包括:
獲取待識別司法文書,對所述待識別司法文書進行分句處理并獲取所述待識別司法文書中包括的案由,所述案由用于表征對案件所涉及的法律關系的性質進行概括后形成的案件名稱;
提取所述待識別司法文書中各句的文本特征,所述文本特征包括詞向量、詞性特征向量、依存句法特征向量以及文本主題詞向量中的一種或多種;
將所述待識別司法文書中第一目標句的文本特征輸入預先訓練生成的所述案由對應的要素識別模型,獲得所述第一目標句對應的第一要素標簽,所述第一目標句為所述待識別司法文書中的任意句;
所述案由對應的要素識別模型是根據訓練數據對初始分類模型進行訓練生成的,所述訓練數據包括待訓練司法文書中第二目標句的文本特征以及所述第二目標句對應的要素標簽,所述待訓練司法文書中包括所述案由,所述第二目標句為所述待訓練司法文書中的任意句。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
將所述第一目標句與預先建立的所述案由對應的要素正則表達式進行匹配;
將與所述第一目標句匹配的要素正則表達式對應的要素標簽確定為所述第一目標句對應的第二要素標簽。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
將所述第一目標句對應的第一要素標簽以及所述第一目標句對應的第二要素標簽取并集,獲得所述第一目標句對應的要素標簽。
4.根據權利要求1所述的方法,其特征在于,所述案由對應的要素識別模型的生成過程包括:
獲取待訓練司法文書,對所述待訓練司法文書進行分句處理,所述待訓練司法文書中包括所述案由;
提取所述待訓練司法文書中各句的文本特征,所述文本特征包括詞向量、詞性特征向量、依存句法特征向量以及文本主題詞向量中的一種或多種;
將所述待訓練司法文書中第二目標句的文本特征以及所述第二目標句對應的至少一個要素標簽作為訓練數據;
根據所述訓練數據對初始分類模型進行訓練生成所述案由對應的要素識別模型。
5.根據權利要求1所述的方法,其特征在于,所述案由對應的要素識別模型的生成過程包括:
獲取待訓練司法文書,對所述待訓練司法文書進行分句處理,所述待訓練司法文書中包括所述案由;
提取所述待訓練司法文書中各句的文本特征,所述文本特征包括詞向量、詞性特征向量、依存句法特征向量以及文本主題詞向量中的一種或多種;
將所述待訓練司法文書中第二目標句的文本特征以及所述第二目標句是否包括目標要素標簽的分類結果作為訓練數據;所述目標要素標簽分別為所述案由對應的要素標簽中的每一個;
根據所述訓練數據對初始分類模型進行訓練分別生成所述目標要素標簽對應的識別模型,將各個要素標簽對應的識別模型組成所述案由對應的要素識別模型。
6.根據權利要求4所述的方法,其特征在于,所述將所述待識別司法文書中第一目標句的文本特征輸入預先訓練生成的所述案由對應的要素識別模型,獲得所述第一目標句對應的第一要素標簽,包括:
將所述待識別司法文書中第一目標句的文本特征輸入所述案由對應的要素識別模型,將所述案由對應的要素識別模型輸出的至少一個要素標簽確定為所述第一目標句對應的第一要素標簽。
7.根據權利要求5所述的方法,其特征在于,所述將所述待識別司法文書中第一目標句的文本特征輸入預先訓練生成的所述案由對應的要素識別模型,獲得所述第一目標句對應的第一要素標簽,包括:
將所述待識別司法文書中第一目標句的文本特征輸入所述目標要素標簽對應的識別模型,獲得所述第一目標句是否包括所述目標要素標簽的分類結果;所述目標要素標簽分別為所述案由對應的要素標簽中的每一個;
根據各個第一目標句是否包括所述目標要素標簽的分類結果,確定所述第一目標句對應的第一要素標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811497428.6/1.html,轉載請聲明來源鉆瓜專利網。





