[發明專利]業務預測方法及裝置有效
| 申請號: | 202011366789.4 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112200392B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 顧凌云;謝旻旗;段灣;王震宇;張陽 | 申請(專利權)人: | 上海冰鑒信息科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/08;G06N20/00;G06F17/18;G06Q10/06 |
| 代理公司: | 成都頂峰專利事務所(普通合伙) 51224 | 代理人: | 匡睿 |
| 地址: | 200000 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 業務 預測 方法 裝置 | ||
本申請實施例提供一種業務預測方法及裝置,在考慮業務驗證通過的業務樣本的同時,兼顧了部分業務驗證被拒絕的業務樣本的數據特征,比較真實地還原了業務場景,減少了拒絕樣本的成本浪費,尤其是在業務驗證通過的樣本量不充分的情況下,合理地均衡了建模樣本和拒絕樣本的需求,由此訓練獲得的業務預測模型在對接收到的待預測業務信息進行預測時,可以預測被拒絕的業務對象的未來行為,從而降低參數估計偏差。
技術領域
本申請涉及機器學習技術領域,具體而言,涉及一種業務預測方法及裝置。
背景技術
通常基于機器學習的業務預測模型可以評估業務所屬分類標簽的業務指標情況。在常規設計中,對于實際的樣本訓練而言,樣本選取對象通常只會選擇業務驗證通過的業務樣本,然后去預測這些業務驗證通過的業務樣本在后續業務使用過程中的行為,那些已經被規則或者業務預測模型拒絕的業務樣本通常會被排除的。這樣訓練得到的業務預測模型,后續在進行業務預測時則無法獲取到那些被拒絕的業務對象的未來行為,也無法判斷這些業務對象的各類業務指標情況,從而導致最終的業務預測模型存在參數估計偏差,導致后續的人工成本浪費。
發明內容
基于現有設計的不足,本申請提供一種業務預測方法及裝置,在考慮業務驗證通過的業務樣本的同時,兼顧了部分業務驗證被拒絕的業務樣本的數據特征,由此訓練獲得的業務預測模型可以預測被拒絕的業務對象的未來行為,從而降低參數估計偏差,減少了成本浪費。
根據本申請的第一方面,提供一種業務預測方法,應用于計算機設備,所述方法包括:
獲取第一業務樣本集和第二業務樣本集,所述第一業務樣本集包括訓練樣本集、測試樣本集和驗證樣本集,所述第二業務樣本集包括拒絕樣本集,其中,所述第一業務樣本集用于表示業務驗證通過的業務樣本,所述第二業務樣本集用于表示業務驗證被拒絕的業務樣本;
根據第一業務樣本集和第二業務樣本集進行訓練獲得業務預測模型,并根據所述業務預測模型對接收到的待預測業務信息進行預測,獲得所述待預測業務信息對應的業務預測結果。
在第一方面的一種可能的實施方式中,所述根據第一業務樣本集和第二業務樣本集進行訓練獲得業務預測模型的步驟,包括:
根據所述訓練樣本集建立第一邏輯回歸模型和第一機器學習模型;
根據所述第一機器學習模型對第一業務樣本集和第二業務樣本集進行迭代樣本分析,并根據樣本分析結果從所述拒絕樣本集中篩選得到目標拒絕樣本集;
根據所述目標拒絕樣本集和所述訓練樣本集建立第二邏輯回歸模型,并分別根據所述第一邏輯回歸模型和所述第二邏輯回歸模型對所述測試樣本集和所述驗證樣本集進行分析,得到所述第一邏輯回歸模型的第一評價指標和所述第二邏輯回歸模型的第二評價指標;
根據所述第一評價指標和所述第二評價指標確定最終的業務預測模型。
在第一方面的一種可能的實施方式中,所述根據所述第一機器學習模型對第一業務樣本集和第二業務樣本集進行迭代樣本分析,并根據樣本分析結果從所述拒絕樣本集中篩選得到目標拒絕樣本集的步驟,包括:
根據所述第一機器學習模型對所述測試樣本集進行分析,建立初始AUC和初始KS;
根據所述第一機器學習模型對所述拒絕樣本集進行分析,基于分析獲得的概率分數對所述拒絕樣本集中的拒絕樣本進行排序,得到排序拒絕樣本集;
從所述排序拒絕樣本集中選擇不同預設規則范圍的拒絕樣本集,并根據所述訓練樣本集和每個預設規則范圍的拒絕樣本集建立對應的第二機器學習模型;
根據每個對應的第二機器學習模型從所述拒絕樣本集中篩選得到目標拒絕樣本集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海冰鑒信息科技有限公司,未經上海冰鑒信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011366789.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





