[發明專利]信息結構化處理方法、裝置及計算機可讀存儲介質在審
| 申請號: | 202011100234.5 | 申請日: | 2020-10-14 |
| 公開(公告)號: | CN112270604A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 吳凡 | 申請(專利權)人: | 招商銀行股份有限公司 |
| 主分類號: | G06Q40/08 | 分類號: | G06Q40/08;G06F16/35;G06K9/62;G06N20/20 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 張志江 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 結構 處理 方法 裝置 計算機 可讀 存儲 介質 | ||
本發明公開了一種信息結構化處理方法。該信息結構化處理方法包括:獲取待處理保險條款文檔,將所述待處理保險條款文檔輸入至預先訓練好的位置標注模型,得到位置標注結果;根據所述位置標注結果對所述待處理保險條款文檔進行截取,得到目標保險條款內容;利用預先訓練好的標簽標注模型對所述目標保險條款內容進行標簽標注,得到標簽標注結果,所述標簽標注結果包括目標標注標簽及其對應的原始信息;對所述原始信息進行結構化處理,得到各目標標注標簽對應的目標信息。本發明還公開了一種信息結構化處理裝置及計算機可讀存儲介質。本發明能夠實現保險條款信息的結構化處理、以便于保險條款的閱讀和信息錄入。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種信息結構化處理方法、裝置及計算機可讀存儲介質。
背景技術
保險條款是保險公司與投保人關于保險權利義務的約定,是保險合同的核心內容。保險合同是一種定式合同,一般而言,條款由保險公司單方面制訂,具有內容復雜、專業性強和非結構化的特點。因此,保險購買者在閱讀時,或保險經紀人在錄入保險條款信息時,往往難以找尋到保險產品的關鍵信息,如保險責任給付的條件、結果、限制等。因此,如何實現保險條款信息的結構化處理、以便于保險條款的閱讀和信息錄入,是目前亟需解決的技術問題。
發明內容
本發明的主要目的在于提供一種信息結構化處理方法、裝置及計算機可讀存儲介質,旨在實現保險條款信息的結構化處理、以便于保險條款的閱讀和信息錄入。
為實現上述目的,本發明提供一種信息結構化處理方法,所述信息結構化處理方法包括:
獲取待處理保險條款文檔,將所述待處理保險條款文檔輸入至預先訓練好的位置標注模型,得到位置標注結果;
根據所述位置標注結果對所述待處理保險條款文檔進行截取,得到目標保險條款內容;
利用預先訓練好的標簽標注模型對所述目標保險條款內容進行標簽標注,得到標簽標注結果,所述標簽標注結果包括目標標注標簽及其對應的原始信息;
對所述原始信息進行結構化處理,得到各目標標注標簽對應的目標信息。
可選地,所述利用預先訓練好的標簽標注模型對所述目標保險條款內容進行標簽標注,得到標簽標注結果的步驟之前,還包括:
獲取第一訓練樣本集,所述第一訓練樣本集包括保險條款內容樣本、真實標注標簽及其真實信息,其中,所述真實標注標簽及其真實信息是基于預設語料庫標注得到的;
通過所述第一訓練樣本集對預設標簽標注模型進行訓練,得到訓練好的標簽標注模型。
可選地,所述預設標簽標注模型包括信息抽取層和分類層;
所述通過所述第一訓練樣本集對預設標簽標注模型進行訓練,得到訓練好的標簽標注模型的步驟包括:
將所述保險條款內容樣本輸入至所述信息抽取層進行信息抽取,得到各保險條款內容樣本對應的特征信息;
將所述特征信息轉換為特征向量,將所述特征向量輸入至所述分類層中,得到預測標注標簽,并根據所述預測標注標簽和所述特征信息確定出對應的預測信息;
根據所述預測標注標簽、所述預測信息、所述保險條款內容樣本的真實標注標簽及其真實信息,計算得到損失值;
根據所述損失值通過梯度下降算法對預設標簽標注模型的參數進行更新,并基于所述第一訓練樣本集進行迭代訓練,得到訓練好的標簽標注模型。
可選地,所述信息結構化處理方法還包括:
獲取保險條款樣本文檔,按產品名稱對所述保險條款樣本文檔進行分類;
對分類后的保險條款樣本文檔的各部分保險條款內容進行聚類分析,得到聚類結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于招商銀行股份有限公司,未經招商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011100234.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種變剛度空氣彈簧及其剛度調控方法
- 下一篇:一種直流電焊機
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





