[發明專利]一種生成預測數據的方法及系統有效
| 申請號: | 202010101858.2 | 申請日: | 2020-02-19 |
| 公開(公告)號: | CN111340276B | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 于博杰;李斌;王永生 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 韓岳松 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 生成 預測 數據 方法 系統 | ||
本發明實施例提供一種生成預測數據的方法和系統,其中所述方法包括,基于基礎數據得到第一數據;基于預測數據確定相應的算法模型;基于所述預測數據與算法模型,從所述第一數據中確定出第二數據;其中,所述第二數據與所述預測數據的相關度高于第一數據與所述預測數據的相關度;從所述第二數據中確定出特征數據,其中,所述特征數據與所述預測數據的相關度高于第二數據與所述預測數據的相關度;基于所述特征數據對所述算法模型進行訓練,得到能夠生成所述預測數據的預測模型,所述預測模型至少與特征數據的權重參數相關。本發明提供的生成預測數據的方法,能夠有效降低預測數據創建過程中的人工投入,降低特征篩選和預測數據生成的復雜度。
技術領域
本發明屬于數據預測領域,具體涉及一種生成預測數據的方法及系統。
背景技術
用戶畫像系統中,業務需求變得越來越多種多樣,業務也越來越關注通過算法、模型推測出的標簽數據,但是用戶標簽數據的創建需要人工手動創建和分析數據,龐大的業務數據由人工進行特征分析,關聯分析,耗費大量時間篩選出影響算法和標簽數據的特征組,特別對于基于算法類生成標簽數據的情況,雖然算法的數量有限,但是為了生成不同的標簽數據,需要做大量的數據分析、特征挑選和算法參數調優的操作,許多重復工作耗費大量的人力和計算資源。
發明內容
本發明提供了一種生成預測數據的方法及系統。
為了解決上述技術問題,本發明實施例提供了如下的技術方案:
本發明第一方面提供一種生成預測數據的方法,所述方法包括,
基于基礎數據得到第一數據;所述第一數據用于表征用戶的特征;
基于預測數據確定相應的算法模型;
基于所述預測數據與算法模型,從所述第一數據中確定出第二數據;所述第二數據表征用戶的特征,其中,所述第二數據與所述預測數據的相關度高于第一數據與所述預測數據的相關度;
從所述第二數據中確定出特征數據,其中,所述特征數據與所述預測數據的相關度高于第二數據與所述預測數據的相關度;
基于所述特征數據對所述算法模型進行訓練,得到能夠生成所述預測數據的預測模型,所述預測模型至少與特征數據的權重參數相關。
作為優選,所述方法還包括,
基于所述預測模型生成所述預測數據。
作為優選,所述基于基礎數據得到第一數據,包括,從所述基礎數據中篩選出一部分數據作為所述第一數據。
作為優選,所述基于所述特征數據對所述算法模型進行訓練,得到能夠生成所述預測數據的預測模型,包括,
基于所述特征數據生成多組待訓練算法模型;
基于所述特征數據對所述多組待訓練算法模型進行訓練,得到所述預測模型。
作為優選,所述基于所述特征數據生成多組待訓練算法模型,包括,
基于所述特征數據形成多組特征數據的權重參數組合;
基于所述權重參數組合形成多組待訓練算法模型的模型參數組合;
基于所述模型參數組合形成多組待訓練算法模型。
作為優選,所述基于所述特征數據對所述多組待訓練算法模型進行訓練,得到所述預測模型,包括,
基于所述特征數據同時對所述多組待訓練算法模型進行訓練,得到多組訓練后模型;
在所述多組訓練后模型中確定出一個準確率最高的訓練后模型作為所述預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010101858.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





