[發明專利]投訴工單結構化處理方法、裝置、設備及存儲介質在審
| 申請號: | 202110304054.7 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113064992A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 李驍;賴眾程;王亮;高洪喜;吳鵬召;張舒婷;李會璟;李林毅 | 申請(專利權)人: | 平安銀行股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/295;G06K9/62 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518001 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 投訴 結構 處理 方法 裝置 設備 存儲 介質 | ||
1.一種投訴工單結構化處理方法,其特征在于,所述投訴工單結構化處理方法包括:
獲取當前投訴工單文本、預先訓練好的層級文本分類模型和結構化信息抽取模型,其中,所述結構化信息抽取模型是基于Bert-CRF模型構建的;
將所述當前投訴工單文本輸入層級文本分類模型中,得到所述當前投訴工單文本的若干個業務層級;
將所述當前投訴工單文本輸入所述結構化信息抽取模型的BERT層,得到所述當前投訴工單中各字符的編碼向量;
將所述編碼向量輸入所述結構化信息抽取模型的CRF層,得到所述當前投訴工單文本中所有字符對應的所有標簽的概率序列組成的所述當前投訴工單文本的概率矩陣;
根據所述概率矩陣確定所述當前投訴工單文本的最優標注序列,并根據所述最優標注序列得到所述當前投訴工單文本的結構化信息和所述結構化信息對應的命名實體;
根據所述當前投訴工單文本的業務層級、結構化信息以及所述結構化信息對應的命名實體生成所述投訴工單的結構化文檔,并將所述結構化文檔保存至預設數據庫中;
獲取用戶輸入的分析維度,并根據所述分析維度從所述數據庫中調取對應的結構化文檔,以供所述用戶進行分析,其中,所述分析維度與所述命名實體、所述業務層級對應。
2.根據權利要求1所述的投訴工單結構化處理方法,其特征在于,所述根據所述概率矩陣確定所述當前投訴工單文本的最優標注序列,并根據所述最優標注序列得到所述當前投訴工單文本的結構化信息和所述結構化信息對應的命名實體包括:
使用維特比算法處理所述當前投訴工單文本的概率矩陣,得到最優標注序列;
根據所述最優標注序列確定所述當前投訴工單文本中各字符的標注類型,得到所述當前投訴工單文本的標注字序列;
篩選所述標注字序列中標注類型相同且字序為連續的字符,組成結構化信息;
根據所述結構化信息對應的標注類型確定所述結構化信息對應的命名實體。
3.根據權利要求1所述的投訴工單結構化處理方法,其特征在于,在所述獲取當前投訴工單文本、預先訓練好的層級文本分類模型和結構化信息抽取模型之前,還包括:
獲取歷史投訴工單數據,并對所述歷史投訴工單數據進行數據預處理,得到模型訓練樣本;
根據所述模型訓練樣本訓練得到層級文本分類模型;
將所述模型訓練樣本根據預設的標注方法進行標注,得到標注數據;
根據預設的劃分比例,將所述標注數據劃分為訓練集和驗證集;
根據所述訓練集和所述驗證集訓練得到結構化信息抽取模型。
4.根據權利要求3所述的投訴工單結構化處理方法,其特征在于,所述層級文本分類模型是基于bert-base模型構建的;
所述根據所述模型訓練樣本訓練得到層級文本分類模型包括:
將所述模型訓練樣本轉化為bert-base模型所需的輸入數據格式;
將所述模型訓練樣本輸入bert-base模型中通過所述bert-base模型得到所述模型訓練樣本的向量表征;
將所述向量表征輸入第一分類層得到所述模型訓練樣本的業務類別一級,并將所述第一分類層的輸出與所述向量表征拼接,得到第一特征向量;
將所述第一特征向量輸入第二分類層得到所述模型訓練樣本的業務類別二級,并將所述向量表征、所述第二分類層的輸出與所述第一分類層的輸出拼接,得到第二特征向量;
將所述第二特征向量輸入至第三分類層得到所述模型訓練樣本的業務類別三級,并將所述第一分類層、所述第二分類層和所述第三分類層的損失函數均設為交叉熵;
將所述模型訓練樣本進行模型訓練得到的業務類別與未進行模型訓練時的業務類別進行比較,經過反復迭代優化,得到層級文本分類模型。
5.根據權利要求4所述的投訴工單結構化處理方法,其特征在于,所述將所述模型訓練樣本轉化為bert-base模型所需的輸入數據格式包括:
在所述模型訓練樣本前增加[CLS]標記;
將所述模型訓練樣本轉換為對應的詞嵌入,并計算得到每個詞所對應的位置嵌入;
將各個詞對應的詞嵌入和位置嵌入相加,得到bert-base模型所需的輸入數據格式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安銀行股份有限公司,未經平安銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110304054.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像清晰度檢測方法、裝置、設備及存儲介質
- 下一篇:攝像鏡頭





