[發明專利]一種數據預測方法、裝置及電子設備在審
| 申請號: | 201810201828.1 | 申請日: | 2018-03-12 |
| 公開(公告)號: | CN108427658A | 公開(公告)日: | 2018-08-21 |
| 發明(設計)人: | 趙知緯 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06K9/62 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 項京;馬敬 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 初始特征向量 數據預測 交疊 線性回歸模型 特征向量 訓練樣本 裝置及電子設備 目標特征向量 樹模型 預設 樣本 計算機領域 擬合算法 算法訓練 樣本結果 影響因素 預測結果 | ||
本發明實施例提供了一種數據預測方法、裝置及電子設備,屬于計算機領域??梢愿鶕郎y初始特征向量和預先訓練的集成樹模型,得到待測初始特征向量對應的交疊特征向量,其中,集成樹模型是根據訓練樣本和預設的集成樹擬合算法訓練得到的,訓練樣本包括多組樣本初始特征向量和多組樣本初始特征向量對應的各樣本結果,然后拼接待測初始特征向量和交疊特征向量,得到目標特征向量,最后根據目標特征向量和預先訓練的線性回歸模型,得到預測結果,其中,線性回歸模型是根據訓練樣本和預設的線性回歸模型算法訓練得到的。采用本發明實施例提供的數據預測方法,可以得到各影響因素之間的交疊因素,即交疊特征向量,從而提高數據預測的精度。
技術領域
本發明涉及計算機領域,特別涉及一種數據預測方法、裝置及電子設備。
背景技術
隨著計算機技術的發展,數據的統計和處理越來越方便,很多行業需要借助計算機技術和統計的數據來預測數據。例如,通過統計已經上映的電影的票房和影響票房的各種因素,來預測一部將要上映的電影的票房?;蛘?,通過統計已經上映的電視劇的播放量和影響播放量的各種因素,來預測一部將要上映的電視劇的播放量。
目前,主要通過線性回歸模型預測數據。例如,在預測電影票房時,通過統計相關已上映的電影的票房和影響這些票房的因素(例如,演職人員的熱度值、演職人員過去作品的票房、電影的檔期或題材等),先確定具體的線性回歸模型,然后將需要預測票房的電影的因素對應的參數輸入線性回歸模型中,從而預測該電影的票房。
然而,發明人在實現本發明的過程中發現,現有技術至少存在如下問題:通過線性回歸模型預測數據時,在考慮各影響因素時,各影響因素通常是相對獨立的,各影響因素之間的相互關系(可以稱為交疊因素)沒有體現,這樣導致預測的結果不準確。
發明內容
本發明實施例的目的在于提供一種數據預測方法、裝置及電子設備,以提高數據預測的精度。具體技術方案如下:
第一方面,提供了一種數據預測方法,所述方法包括:
根據待測初始特征向量和預先訓練的集成樹模型,得到所述待測初始特征向量對應的交疊特征向量,其中,所述集成樹模型是根據訓練樣本和預設的集成樹擬合算法訓練得到的,所述訓練樣本包括多組樣本初始特征向量和所述多組樣本初始特征向量對應的各樣本結果;
拼接所述待測初始特征向量和所述交疊特征向量,得到目標特征向量;
根據所述目標特征向量和預先訓練的線性回歸模型,得到預測結果,其中,所述線性回歸模型是根據所述訓練樣本和預設的線性回歸模型算法訓練得到的。
可選的,所述集成樹模型的訓練過程包括:
獲取訓練樣本,所述訓練樣本包括多組樣本初始特征向量和所述多組樣本初始特征向量對應的各樣本結果;
根據所述訓練樣本和預設的集成樹模型擬合算法,訓練得到集成樹模型。
可選的,所述集成樹模型為梯度提高集成樹模型。
可選的,所述線性回歸模型的訓練過程包括:
獲取所述訓練樣本,所述訓練樣本包括多組樣本初始特征向量和所述多組樣本初始特征向量對應的各樣本結果;
根據所述多組樣本初始特征向量和所述集成樹模型,得到所述多組樣本初始特征向量對應的各樣本交疊特征向量;
拼接所述多組樣本初始特征向量和對應的樣本交疊特征向量,得到多組樣本目標特征向量;
根據所述多組樣本目標特征向量和對應的樣本結果,以及預設的線性回歸模型算法,訓練得到線性回歸模型。
可選的,所述預設的線性回歸模型算法為最小二乘法。
第二方面,提供了一種數據預測裝置,所述裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810201828.1/2.html,轉載請聲明來源鉆瓜專利網。





