[發明專利]一種法律案件爭議焦點獲取方法、裝置以及計算機設備有效
| 申請號: | 202011386072.6 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112487146B | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 胡峰;李子楊;鄧維斌;王曉浪;禹航 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06K9/62;G06N7/00 |
| 代理公司: | 重慶輝騰律師事務所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 法律 案件 爭議 焦點 獲取 方法 裝置 以及 計算機 設備 | ||
1.一種法律案件爭議焦點獲取方法,其特征在于,包括以下步驟:
S1、獲取具有爭議焦點的法律文本;
S2、采用規則匹配方法得出爭議焦點的類別并將其作為標簽,制作法律案件爭議焦點數據集;
S21、采用規則匹配方法尋找出歷史爭議焦點數據的焦點類型的概率值或者距離值;
S22、按照焦點類型的概率值或者距離值所對應的均方根誤差,求取出對應的回歸值;
S23、求取出均方根誤差值所對應的損失值最小時的分配系數,在該分配系數下,通過改變初始回歸值,從而確定出最小損失函數下的回歸預測值;
S24、利用分配系數與相應的回歸預測值乘積作為焦點數據的第一標簽,形成增強后的法律案件爭議焦點數據集;
S3、將原被告陳述內容作為輸入,采用孿生BERT模型,對所述法律案件爭議焦點數據集進行訓練,得到訓練模型結果;
S4、在訓練好的模型中輸入未知爭議焦點的法律文本,輸出焦點類型的標簽,并得到最終爭議焦點結果。
2.根據權利要求1所述的一種法律案件爭議焦點獲取方法,其特征在于,采用規則匹配方法尋找出歷史爭議焦點數據的焦點類型的概率值包括對提取出的爭議焦點去掉冗余詞與共有詞,并進行同義詞轉換;統計出各焦點類型包含的關鍵詞;生成焦點類型關鍵詞字典;獲取焦點描述詞,將焦點描述詞與所述焦點類型關鍵詞字典進行比較,得到各焦點描述詞屬于焦點類型關鍵詞字典中焦點類型的概率值。
3.根據權利要求1所述的一種法律案件爭議焦點獲取方法,其特征在于,采用規則匹配方法尋找出歷史爭議焦點數據的焦點類型的距離值包括對提取出的爭議焦點去除冗余詞與共有詞;并進行同義詞轉換;根據爭議焦點的類型列表,統計出已處理的爭議焦點中各類型的爭議焦點,生成焦點關鍵詞;將焦點關鍵詞中的各爭議焦點轉換為爭議詞向量,以爭議焦點詞向量的均值作為爭議焦點句向量,得到焦點類型句向量,獲取法律樣本中的焦點句,通過相似度計算得到焦點類型的距離值。
4.根據權利要求1所述的一種法律案件爭議焦點獲取方法,其特征在于,所述采用規則匹配方法得出爭議焦點的類別并將其作為標簽,制作法律案件爭議焦點數據集還包括為歷史爭議焦點的法律文本設置出原被告優先級、時間優先級以及區域優先級,選擇出綜合優先級最高的爭議焦點作為第一數據集,將相應時間段的爭議焦點的概率值均值或者距離值均值分別作為第一數據集對應的初始回歸值,通過最小化損失函數,確定出該時間段所對應的分配系數,在該分配系數下,通過改變初始回歸值,從而確定出最小化損失函數所對應的回歸值,將每時間段的分配系數與相應時間段的最小化損失函數下的回歸值之間的乘積作為該歷史爭議焦點的焦點類型,并確定出該焦點類型的第一標簽。
5.根據權利要求4所述的一種法律案件爭議焦點獲取方法,其特征在于,所述焦點類型的爭議焦點結果表示為{R1,R2,......Rn},其中n為整理所得所有的爭議焦點個數,將其作為標簽{label1,label2,......,labeln},并將原被告陳述內容進行整理和提取,得到原告陳述內容Yi,1≤i≤m,其中m為法律文本總篇數;被告陳述內容Bi,1≤i≤m;每個案件的原被告內容相對應,且都對應n個標簽;得到法律案件爭議焦點數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011386072.6/1.html,轉載請聲明來源鉆瓜專利網。





