[發明專利]構造產率預測模型的方法、系統及產率預測方法和系統在審
| 申請號: | 201810946541.1 | 申請日: | 2018-08-17 |
| 公開(公告)號: | CN109192264A | 公開(公告)日: | 2019-01-11 |
| 發明(設計)人: | 楊帆;金繼民;金寶寶;張成松 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G16H20/10 | 分類號: | G16H20/10 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 呂雁葭 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 產率 訓練數據 預測模型 權重 預測 權重構造 隨機森林 預測系統 映射 概率 | ||
1.一種構造產率預測模型的方法,包括:
獲得訓練數據,所述訓練數據包括可能影響產率的多個因素的數據以及產率的數據;
獲得多個因素集以及與所述因素集對應的權重;
基于因素與產率的相互關系,將所述多個因素映射到所述多個因素集中;以及
基于處理后的訓練數據和所述權重構造用于產率預測的隨機森林模型,其中,所述權重與生成節點時,作為選擇對應的因素集的因素的概率相關。
2.根據權利要求1所述的方法,其中,所述基于因素與產率的相互關系,將所述多個因素映射到所述多個因素集中包括:
確定用于表征各個因素與產率的相關性的第一參數值,和/或
確定用于表征各個因素與產率的因果性的第二參數值;
基于所述第一參數值和/或第二參數值,將所述多個因素映射到所述多個因素集中,其中,所述所述多個因素集至少包括第一因素集和第二因素集。
3.根據權利要求2所述的方法,還包括:
將指定因素映射到第三因素集中,其中,所述指定因素基于輸入操作確定。
4.根據權利要求2所述的方法,其中,所述基于所述第一參數值和/或第二參數值,將所述多個因素映射到所述多個因素集中包括:
將所述第一參數值大于第一閾值或第二參數值大于第二閾值的因素映射到第一參數集;
將所述第一參數值不大于第一閾值且第二參數值不大于第二閾值的因素映射到第二參數集。
5.根據權利要求4所述的方法,還包括:
基于用于表征指定因素與產率的相關性的第三參數值,確定所述第一閾值;并且/或者
基于用于表征指定因素與產率的因果性的第四參數值,確定所述第二閾值,
其中,所述指定因素基于輸入操作確定。
6.根據權利要求1所述的方法,其中,所述基于所述訓練數據和所述權重構造用于產率預測的隨機森林模型包括,對于樹的每一個節點的生成:
基于所述權重,隨機確定一個因素集;以及
基于所述訓練數據,從所述因素集中確定一個因素,用于生成該節點,
其中,所述基于所述訓練數據,從所述因素集中確定一個因素包括,
基于所述訓練數據,從所述因素集中確定一個能夠使分類后的訓練數據的不確定性降低最多的因素。
7.根據權利要求1所述的方法,還包括對齊訓練數據的時間間隔,所述對齊訓練數據的時間間隔包括以下至少一種:
通過插值的方式縮小時間間隔;或者
通過采樣的方式增大時間間隔。
8.一種產率預測方法,包括:
獲得可能影響產率的多個因素;以及
將所述多個因素輸入如權利要求1~7中任意一項所述的隨機森林模型,獲得產率預測結果。
9.一種構造產率預測模型的系統,包括:
訓練數據獲得模塊,用于獲得訓練數據,所述訓練數據包括可能影響產率的多個因素的數據以及產率的數據;
因素集獲得模塊,用于獲得多個因素集以及與所述因素集對應的權重;
因素映射模塊,用于基于因素與產率的相互關系,將所述多個因素映射到所述多個因素集中;以及
模型構造模塊,用于基于處理后的訓練數據和所述權重構造用于產率預測的隨機森林模型,其中,所述權重與生成節點時,作為選擇對應的因素集的因素的概率相關。
10.一種產率預測系統,包括:
因素獲得模塊,用于獲得可能影響產率的多個因素;以及
產率預測模塊,用于將所述多個因素輸入如權利要求1~7中任意一項所述的隨機森林模型,獲得產率預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810946541.1/1.html,轉載請聲明來源鉆瓜專利網。





