[發明專利]一種基于裁判文書的論辯觀點挖掘方法及系統在審
| 申請號: | 202011287899.1 | 申請日: | 2020-11-17 |
| 公開(公告)號: | CN112651853A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 李鑫;王竹;翁洋;其他發明人請求不公開姓名 | 申請(專利權)人: | 四川大學;成都數之聯科技有限公司 |
| 主分類號: | G06Q50/18 | 分類號: | G06Q50/18;G06F16/35 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 林菲菲 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 裁判 文書 論辯 觀點 挖掘 方法 系統 | ||
本發明公開了一種基于裁判文書的論辯觀點挖掘方法及系統,本發明的方法包括:分段裁判文書,得到原告訴稱的段落內容和被告辯稱的段落內容;分別將原告訴稱的段落內容和被告辯稱的段落內容分句;一一匹配原告訴稱的分句內容與被告辯稱的分句內容,判斷原告訴稱和被告辯稱的兩個分句內容是否能夠組成辯論對。本發明借助計算機技術以及自然語言處理技術自動識別提取裁判文書中的爭議焦點,利用機器學習算法提取裁判文書中的辯論對。
技術領域
本發明屬于自然語言處理技術領域,具體涉及一種基于裁判文書的論辯觀點挖掘方法及系統。
背景技術
隨著新訴訟制度的逐步形成,中國法院圍繞有爭議的問題組織辯論。有爭議的問題是雙方沖突的核心。而找出圍繞原告和被告對有爭議問題展開的辯論對,能夠更加清晰明了的找出問題的核心所在。這些論辯對有助于在法庭審判中集中事實調查,而法律爭議性問題有助于法庭辯論組織和法律適用。判決書體現了法律論證的過程,判決書中所包含的爭議問題在庭審過程中被整理、調查和辯論。因此,針對有爭議性問題的雙方論辯在審判現場的恢復和法官的決策中起著關鍵的作用。
到目前為止,網上公布的判決數量超過了8000萬。然而,有效地識別海量數據中的關鍵信息將是一個巨大的挑戰。同時在數量有限的情況下,由于訪問權限的限制,法官很難利用其他法官的經驗總結爭議性問題并進行試驗,這極大地阻礙了經驗的傳播和法律知識的積累。然而,由于語料庫龐大、表達式多樣、門類繁多,人為識別提取論辯對效率低,且成本高。
發明內容
為了解決現有人為識別提取辯論對效率低、成本高的技術問題,本發明提供了一種基于裁判文書的論辯觀點挖掘方法及系統。本發明能夠自動處理并識別裁判文書的辯論觀點。
本發明通過下述技術方案實現:
一種基于裁判文書的論辯觀點挖掘方法,該方法包括以下步驟:
分段裁判文書得到原告訴稱的段落內容和被告辯稱的段落內容;
分別將原告訴稱的段落內容和被告辯稱的段落內容進行分句;
一一匹配原告訴稱的分句內容與被告辯稱的分句內容,判斷原告訴稱和被告辯稱的兩個分句內容是否能夠組成辯論對。
優選的,本發明的對裁判文書進行分段的步驟具體為:
通過裁判文書結構化的方法對裁判文書進行分段。
優選的,本發明的分別將原告訴稱的段落內容和被告辯稱的段落內容進行分句的步驟具體包括:
對段落內容進行基礎分句;
采用Bert模型對相鄰兩個基礎分句進行二分類,確定兩個基礎分句是否在對同一個問題進行辯論。
優選的,本發明的一一匹配原告訴稱的分句內容與被告辯稱的分句內容,判斷原告訴稱和被告辯稱的兩個分句內容是否能夠組成辯論對的步驟具體為:
采用Bert模型對一一匹配的原告訴稱的分句內容與被告辯稱的分句進行二分類,確定兩個分句是否在對同一問題進行辯論。
優選的,本發明的Bert模型訓練過程包括以下步驟:
將輸入數據輸入Bert預訓練模型;其中,所述輸入數據結構為(sentence1,sentence2, label),sentence1和sentence2分別表示需要分類的兩個句子,label為標簽,用于表示兩個句子是否在對同一個問題進行辯論;
提取Bert模型的CLS位置的輸出向量作為句子向量表示;
在得到的句子向量表示后面增加一個softmax層進行分類。
另一方面,本發明還提出了一種基于裁判文書的論辯觀點挖掘系統,該系統包括分段模塊、分句模塊和識別模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學;成都數之聯科技有限公司,未經四川大學;成都數之聯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011287899.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種換擋輔助裝置
- 下一篇:土木機械加工用鋼管切割裝置





