[發明專利]退單處理模型訓練方法、處理方法、裝置、設備及介質在審
| 申請號: | 202011636325.0 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112699944A | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 王欣晟;陸堃彪;張青清;李航 | 申請(專利權)人: | 中國銀聯股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/10;G06Q40/04 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 賀琳 |
| 地址: | 200135 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 處理 模型 訓練 方法 裝置 設備 介質 | ||
1.一種退單處理方法,其特征在于,包括:
將錄入的退單事件的描述內容轉化為退單事件向量;
將所述退單事件向量作為預設的退單處理模型的輸入,得到所述退單處理模型輸出的退單理由分類結果,所述退單理由分類結果用于表征通過所述退單處理模型預測得到的所述退單事件的退單理由,所述退單處理模型是基于退單樣本向量利用分類算法訓練得到的分類模型;
根據所述退單理由分類結果,輸出所述退單事件的退單理由。
2.根據權利要求1所述的方法,其特征在于,所述將錄入的退單事件的描述內容轉化為退單事件向量,包括:
對錄入的所述退單事件的描述內容進行規范化處理;
對規范化處理后的所述退單事件的描述內容進行分詞,得到所述退單事件的描述內容中的描述詞匯;
根據存在于預設的詞匯庫中的所述描述詞匯在所述退單事件的描述內容中的出現頻次,生成所述退單事件向量。
3.根據權利要求2所述的方法,其特征在于,所述對錄入的所述退單事件的描述內容進行規范化處理,包括:
將錄入的記載有所述退單事件的描述內容的非結構化文件或半結構化文件轉化為記載有所述退單事件的描述內容的標準模板;
解析記載有所述退單事件的描述內容的標準模板,得到與所述退單事件的描述內容對應的結構化數據;
對所述結構化數據進行數據清洗,得到規范化處理后的所述退單事件的描述內容。
4.根據權利要求1所述的方法,其特征在于,
所述退單理由分類結果包括所述退單事件的退單理由的理由標識碼;
或者,
所述退單理由分類結果包括多個退單理由的理由標識碼及各退單理由的預測值,所述預測值用于表征退單理由與所述退單事件的匹配度。
5.根據權利要求1所述的方法,其特征在于,還包括:
基于所述退單處理模型和所述退單事件向量,得到所述退單事件向量中各元素對退單理由的貢獻值。
6.根據權利要求5所述的方法,其特征在于,所述退單處理模型包括決策樹;
所述基于所述退單處理模型和所述退單事件向量,得到所述退單事件向量中各元素對退單理由的貢獻值,包括:
基于第一詞匯集合,確定去除目標詞匯的目標詞匯集合,所述第一詞匯集合為包括所述退單事件向量中元素對應的描述詞匯的集合,所述目標詞匯為所述退單事件向量中任意一個元素所對應的所述描述詞匯;
根據所述決策樹中葉子節點的值及葉子節點對應的邊的權重,計算得到所述目標詞匯在所述退單事件向量對應的第一平均值和第二平均值,所述第一平均值為所述目標詞匯集合在所述決策樹的取值的平均值,所述第二平均值為所述目標詞匯集合與所述目標詞匯的并集在所述決策樹的取值的平均值;
基于所述第一平均值、所述第二平均值、所述目標詞匯集合中的元素數目、所述第一詞匯集合中的元素數目,確定所述目標詞匯對退單理由的貢獻值。
7.一種退單處理模型訓練方法,其特征在于,包括:
將錄入的退單樣本事件的描述內容轉化為退單樣本向量;
設置分類模型的模型參數,根據所述模型參數對所述分類模型進行初始化;
選取至少部分所述退單樣本向量作為訓練集合,對所述分類模型進行迭代訓練,得到退單處理模型,所述退單處理模型的輸入包括所述退單樣本向量,所述退單處理模型的輸出包括退單理由分類結果,所述退單理由分類結果用于表征通過所述退單處理模型預測得到的所述退單樣本事件的退單理由。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀聯股份有限公司,未經中國銀聯股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011636325.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:入墻式暗裝可伸縮出水接頭及安裝方法
- 下一篇:LED顯示屏





