[發明專利]一種構建票據審核模型的方法在審
| 申請號: | 202010195820.6 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111428103A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 簡仁賢;湯潘;馬永寧 | 申請(專利權)人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906;G06Q40/00 |
| 代理公司: | 北京挺立專利事務所(普通合伙) 11265 | 代理人: | 田黎絨 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 構建 票據 審核 模型 方法 | ||
1.一種構建票據審核模型的方法,其特征在于:包括以下步驟,
步驟一、從預置數據庫中調取與審核點對應的訓練樣本集,所述訓練樣本集中有多個訓練樣本數據,每個所述訓練樣本數據包括訓練輸入字段和訓練輸出字段;
步驟二、調取與審核點關聯的模型,并以步驟一中的多個訓練樣本數據對模型進行訓練;
步驟三、從預置數據庫中調取與審核點對應的測試樣本集,所述測試樣本集中有多個測試樣本數據,每個所述測試樣本數據包括測試輸入字段和測試輸出字段;
步驟四、調取步驟二中訓練完成的模型,并以步驟三中的多個測試樣本數據對模型進行測試;若測試結果的準確率>閾值,則輸出模型,所述準確率=預測正確測試樣本數據總數/測試樣本數據總數,所述閾值為60%~100%;
所述審核點包括審核輸入字段和審核輸出字段。
2.按照權利要求1所述的一種構建票據審核模型的方法,其特征在于:所述審核點的審核輸入字段和審核輸出字段均為string類型時,步驟二中調取的模型為分類模型。
3.按照權利要求2所述的一種構建票據審核模型的方法,其特征在于:所述分類模型為fasttext模型。
4.按照權利要求2或3所述的一種構建票據審核模型的方法,其特征在于:步驟四中,當一個測試輸入字段輸入的分類模型后,取所述分類模型輸出的排序前五的五個字段,將該五個字段逐個與測試輸出字段進行比對,若所述五個字段中有一個字段與測試輸出字段相同,則記錄一個預測正確測試樣本數據數。
5.按照權利要求1所述的一種構建票據審核模型的方法,其特征在于:所述審核點的審核輸入字段為string類型,且審核輸出字段為float類型時,步驟二中調取的模型為統計模型。
6.按照權利要求5所述的一種構建票據審核模型的方法,其特征在于:在步驟一中,訓練樣本集中的多個訓練樣本數據的訓練輸入字段內容相同,在步驟三中,測試樣本集中的多個測試樣本數據的測試輸入字段內容相同,且測試樣本數據的測試輸入字段內容與訓練樣本數據的訓練輸入字段內容相同;
所述統計模型在步驟二訓練時,將對各所述訓練樣本數據的輸出字段進行集合,獲得集合C,對集合C計算均值mean和標準差std,以[mean-α*std,mean+α*std]為合理區間,其中α=3、3.5、4、4.5或5;
所述統計模型在步驟四測試時,對每個測試樣本數據的測試輸出字段進行判斷,判斷測試輸出字段是否在合理區間[mean-α*std,mean+α*std]中,若在,則記錄一個預測正確測試樣本數據數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于竹間智能科技(上海)有限公司,未經竹間智能科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010195820.6/1.html,轉載請聲明來源鉆瓜專利網。





