[發明專利]一種基于深度學習的合同審核方法、裝置及電子設備在審
| 申請號: | 202011315250.6 | 申請日: | 2020-11-20 |
| 公開(公告)號: | CN112487803A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 殷瑩;丁瑋;金濤;尹雨瑩 | 申請(專利權)人: | 中國人壽保險股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/242;G06F16/33;G06F16/35;G06N3/04 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 李莎 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 合同 審核 方法 裝置 電子設備 | ||
1.一種基于深度學習的合同審核方法,其特征在于,包括:
獲取合同樣本數據,將所述合同樣本數據分解為合同文本段,利用所述合同文本段創建訓練數據集;
對所述合同文本段進行聚類處理,根據聚類結果在所述訓練數據集中為所述合同文本段添加相應的類屬性標記;
構建神經網絡模型,利用所述訓練數據集對所述神經網絡模型進行訓練優化,得到優化審核模型;
利用所述優化審核模型對待審核合同文本進行處理。
2.根據權利要求1所述的方法,其特征在于,所述利用所述合同文本段創建訓練數據集,包括:
將預設專業詞庫作為分詞配置文件對所述合同文本段進行分詞處理;
根據分詞處理結果濾除所述合同文本段中的非相關分詞;
利用濾除所述非相關分詞后的所述合同文本段創建訓練數據集。
3.根據權利要求2所述的方法,其特征在于,所述對所述合同文本段進行聚類處理,包括:
計算所述合同文本段中每個分詞的詞頻與逆向文本頻率,根據所述詞頻與所述逆向文本頻率確定所述分詞的詞頻-逆向文本特征;
將所述合同文本段作為聚類對象,將所述合同文本段所包括的多個所述分詞的所述詞頻-逆向文本特征作為所述聚類對象的多維度屬性,利用K均值聚類算法,對多個所述合同文本進行聚類,聚類結果的多個類簇分別與多個合同條款種類一一對應。
4.根據權利要求1所述的方法,其特征在于,所述神經網絡模型包括卷積網絡層與全連接層;
所述卷積網絡層包括兩層卷積神經網絡,每層所述卷積神經網絡包括200個神經節點;
在兩層所述卷積神經網絡之間采用非線性激活函數并設置最大池化層。
5.根據權利要求4所述的方法,其特征在于,在所述卷積網路層與全連接層還設置阻斷層;
所述組斷層用于所述卷積網絡層與所述全連接層進行數據傳輸時,隨機阻斷部分神經元的數據傳輸。
6.根據權利要求4所述的方法,其特征在于,利用所述訓練數據集對所述神經網絡模型進行訓練優化,得到優化審核模型,包括:
將所述合同文本段作為輸入數據,對所述神經網絡模型進行訓練;
將所述神經網絡模型針對所述合同文本段處理后的輸出數據,與所述合同文本段對應的類屬性標記進行對比;
利用損失函數量來衡量所述輸出數據與對應的所述類屬性標記之間的差異;
根據所述損失函數對所述神經網絡模型的網絡結構、每層卷積神經網絡中的神經節點數量、所述非線性激活函數參數進行調整,直至所述損失函數的值小于差異閾值;
調整后的所述神經網絡模型即所述優化審核模型。
7.根據權利要求6所述的方法,其特征在于,所述損失函數采用L2正則化計算機制。
8.根據權利要求1所述的方法,其特征在于,所述利用所述優化審核模型對待審核合同文本進行處理,包括:
將所述待審核合同文本分解為多個待審核合同文本段;
將所述待審核合同文本段作為輸入數據,利用所述優化審核模型對所述待審核合同文本段進行處理,得到審核輸出數據;
根據所述審核輸出數據確定所述待審核合同文本段的合同條款種類;
將所述待審核合同文本所涉及的全部合同條款種類與指定合同條款目錄進行對比,確定所述待審核合同文本是否缺失指定合同條款。
9.一種基于深度學習的合同審核裝置,其特征在于,包括:
訓練樣本模塊,被配置為獲取合同樣本數據,將所述合同樣本數據分解為合同文本段,利用所述合同文本段創建訓練數據集;
聚類模塊,被配置為對所述合同文本段進行聚類處理,根據聚類結果在所述訓練數據集中為所述合同文本段添加相應的類屬性標記;
神經網絡模塊,被配置為構建神經網絡模型,利用所述訓練數據集對所述神經網絡模型進行訓練優化,得到優化審核模型;
文本審核模塊,被配置為利用所述優化審核模型對待審核合同文本進行處理。
10.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至8任意一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人壽保險股份有限公司,未經中國人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011315250.6/1.html,轉載請聲明來源鉆瓜專利網。





