[發明專利]一種數據分析處理系統及自動建模方法在審
| 申請號: | 201810632499.6 | 申請日: | 2018-06-19 |
| 公開(公告)號: | CN109389143A | 公開(公告)日: | 2019-02-26 |
| 發明(設計)人: | 姜琦;路宏琦;耿迪;路明奎 | 申請(專利權)人: | 北京九章云極科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;胡影 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據分析處理系統 用戶界面 場景 業務模型 用戶設置 自動建模 算法 用戶選擇模型 策略創建 用戶體驗 自動選擇 自動化 創建 | ||
本發明提供一種數據分析處理系統及自動建模方法,該方法包括:顯示用戶界面,所述用戶界面用于供用戶設置用于創建業務模型的場景和數據;獲取用戶在所述用戶界面上設置的場景和/或數據;根據獲取的所述場景和/或數據,從多個模型策略中選擇一模型策略,根據選擇的模型策略創建業務模型,所述模型策略至少包括以下信息:算法和所述算法的參數調優方法。本發明中,能夠根據用戶設置的場景和/或數據,自動選擇模型策略,不需要用戶選擇模型策略,提高了數據分析處理系統的自動化程度,提高了用戶體驗。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種數據分析處理系統及自動建模方法。
背景技術
當前的數據分析處理系統進行業務模型訓練的主要方式為:從數據庫中將用于訓練業務模型的數據導出到本地,由建模師利用第三方建模工具,根據業務需求選擇模型策略,訓練業務模型,在訓練業務模型的過程中不斷地人工調試,得到優化的模型參數,從而得到訓練出的業務模型。
上述業務模型訓練方式存在很大弊端:業務模型訓練的過程復雜,自動化程度低,不適用于非專業的用戶使用。
發明內容
有鑒于此,本發明提供一種數據分析處理系統及自動建模方法,以解決現有的數據分析處理系統訓練模型過程復雜,自動化程度低的問題。
為解決上述技術問題,本發明提供一種數據分析處理系統的自動建模方法,包括:
顯示用戶界面,所述用戶界面用于供用戶設置用于創建業務模型的場景和數據;
獲取用戶在所述用戶界面上設置的場景和/或數據,并根據獲取的所述場景和/或數據,從多個模型策略中選擇一模型策略,根據選擇的模型策略創建業務模型,所述模型策略至少包括以下信息:算法和所述算法的參數調優方法。
優選地,所述模型策略還包括以下信息中的至少之一:所述算法的評估方法、所述算法的參數設置方法、所述數據的拆分方法、所述數據的處理方法和所述數據的特征選擇方法。
優選地,所述用戶界面還用于供用戶設置用于創建業務模型的目標特征。
優選地,所述顯示用戶界面的步驟包括:
在所述用戶界面上顯示場景表單供用戶選擇;
當檢測到用戶選擇所述場景表單中的一場景的操作時,在所述用戶界面上顯示選擇的場景;
或者
在所述用戶界面上顯示場景輸入區域;
當檢測到用戶在所述輸入區域輸入場景的操作時,獲取用戶輸入的所述場景;
將場景表單中與用戶輸入的場景匹配的場景顯示在所述用戶界面上。
優選地,所述場景包括以下至少之一:對應聚類算法的場景、對應分類算法的場景、對應回歸算法的場景、對應異常檢測的場景和對應語言處理的場景。
優選地,當所述場景為對應聚類算法的場景時,所述選擇的模型策略的信息包括:算法和所述算法的參數調優方法,所述算法包括以下至少之一:層次聚類、貝葉斯高斯混合、KD樹、受限波爾茲曼機,所述算法的參數調優方法基于超參數優化進行,所述超參數優化的方法包括以下至少之一:隨機參數搜索方法、網格參數搜索方法、輪廓系數方法;
當所述場景為對應分類算法的場景時,所述選擇的模型策略的信息包括:算法和所述算法的參數調優方法,所述算法包括以下至少之一:邏輯回歸、隨機森林、Bagging、AdaBoost、神經網絡、堆棧模型,所述算法的參數調優方法基于超參數優化進行,所述超參數優化的方法包括以下至少之一:隨機參數搜索方法、網格參數搜索方法、曲線下面積AUC分數方法;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京九章云極科技有限公司,未經北京九章云極科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810632499.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:分類器訓練方法
- 下一篇:一種基于菜品識別的菜品組成分析系統和方法





