[發(fā)明專利]案件處理模型的訓練方法、案件文本處理方法及相關裝置有效
| 申請?zhí)枺?/td> | 202010610510.6 | 申請日: | 2020-06-29 |
| 公開(公告)號: | CN111737416B | 公開(公告)日: | 2022-08-19 |
| 發(fā)明(設計)人: | 熊永福 | 申請(專利權)人: | 重慶紫光華山智安科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/295;G06F40/30 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 李莎 |
| 地址: | 400700 重慶市*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 案件 處理 模型 訓練 方法 文本 相關 裝置 | ||
1.一種案件處理模型的訓練方法,其特征在于,所述方法包括:
獲取訓練樣本數據;所述訓練樣本數據包括案件文本和所述案件文本對應的標注結果,所述標注結果包括所述案件文本所屬小類的類別標注結果和所述案件文本中的實體對應的實體標注結果;
將所述訓練樣本數據輸入預先建立的案件處理模型,利用所述案件處理模型的特征抽取層輸出文本特征向量;所述文本特征向量包括文本整體語義的特征表示;
將所述文本整體語義的特征表示輸入所述案件處理模型的分類層,得到所述案件文本所屬小類的類別預測結果;
將所述文本特征向量輸入所述案件處理模型的實體抽取層,得到所述案件文本中的實體對應的實體預測結果;
依據所述類別標注結果、實體標注結果、類別預測結果和實體預測結果更新所述案件處理模型的參數,以得到訓練后的案件處理模型。
2.根據權利要求1所述的案件處理模型的訓練方法,其特征在于,所述文本特征向量還包括所述案件文本中每個文本字符對應的特征表示,所述實體抽取層包括激活層和條件隨機場CRF層,所述將所述文本特征向量輸入所述案件處理模型的實體抽取層,得到所述案件文本中的實體對應的實體預測結果的步驟包括:
利用所述激活層對所述案件文本中每個文本字符對應的特征表示進行標簽分類,得到分類結果;所述分類結果包括每個文本字符對應的特征表示屬于不同類別的標簽的概率,所述不同類別的標簽包括實體的開始部分、實體的非開始部分和非實體部分;
將所述分類結果輸入所述CRF層,利用所述CRF層學習到的轉移矩陣獲得不同標簽之間的關聯(lián)關系,進而得到所述案件文本中的實體對應的實體預測結果;其中,所述轉移矩陣中的每個元素表示一個標簽轉移到另一個標簽的概率。
3.根據權利要求2所述的案件處理模型的訓練方法,其特征在于,所述將所述分類結果輸入所述CRF層的步驟之后,所述方法還包括:
對所述CRF層的學習率進行擴張?zhí)幚怼?/p>
4.根據權利要求2所述的案件處理模型的訓練方法,其特征在于,所述依據所述類別標注結果、實體標注結果、類別預測結果和實體預測結果更新所述案件處理模型的參數,以得到訓練后的案件處理模型的步驟包括:
根據所述類別標注結果和所述類別預測結果計算所述分類層的損失函數;
根據所述實體標注結果和所述實體預測結果計算所述CRF層的損失函數;
將所述分類層的損失函數和所述CRF層的損失函數之和作為所述案件處理模型的損失函數;
根據所述案件處理模型的損失函數更新所述案件處理模型的參數,直到所述案件處理模型收斂;
利用驗證樣本數據對完成訓練的案件處理模型進行測試,選取出具有最優(yōu)模型參數的案件處理模型,進而得到所述訓練后的案件處理模型。
5.根據權利要求4所述的案件處理模型的訓練方法,其特征在于,所述分類層的損失函數采用自適應交叉熵損失函數,所述CRF層的損失函數采用離散交叉熵損失函數。
6.根據權利要求1-5任一項所述的案件處理模型的訓練方法,其特征在于,所述訓練樣本數據還包括所述案件文本所屬大類的類別信息。
7.一種案件文本處理方法,其特征在于,所述方法包括:
獲取待處理案件文本;
將所述待處理案件文本輸入利用如權利要求1-6任一項所述的方法訓練得到的所述案件處理模型,得到所述案件文本所屬小類的類別信息、所述案件文本中的各類實體所在的位置以及各類實體對應的屬性類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶紫光華山智安科技有限公司,未經重慶紫光華山智安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010610510.6/1.html,轉載請聲明來源鉆瓜專利網。





