[發明專利]基于完全隨機森林的矢量空間計算強度預測方法及系統有效
| 申請號: | 201711387102.3 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN108052755B | 公開(公告)日: | 2019-09-17 |
| 發明(設計)人: | 郭明強;黃穎;謝忠;關慶鋒;吳亮;劉袁緣 | 申請(專利權)人: | 中國地質大學(武漢) |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50;G06F16/56 |
| 代理公司: | 武漢知產時代知識產權代理有限公司 42238 | 代理人: | 馮必發 |
| 地址: | 430074 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 完全 隨機 森林 矢量 空間 計算 強度 預測 方法 系統 | ||
一種基于完全隨機森林的矢量空間計算強度預測方法及系統,通過輸入與矢量空間計算強度相關的所有特征,訓練多棵完全回歸決策樹,實現對特征復雜多樣的矢量空間計算域的計算強度建模,并對完全隨機森林的預測結果進行優化,剔除與預測結果偏差較大的預測值,提高完全隨機森林的預測精度,有利于在并行計算環境中,對矢量空間計算強度進行精準的預測。本發明在隨機森林的訓練過程中,每棵回歸決策樹的訓練樣本是從原始樣本中隨機選擇的,且選擇的特征包括原始樣本的全部特征,該模型能夠應對重要特征少、冗余特征多的矢量空間計算強度的預測,本發明可以為并行計算資源均衡調度與分配提供依據,提高并行計算效率。
技術領域
本發明涉及高性能地理空間計算技術,尤其是一種基于完全隨機森林的矢量空間計算強度預測方法及系統。
背景技術
矢量空間計算強度的建模和預測是高性能空間計算中的需要解決的關鍵問題之一,在并行計算環境中,可根據矢量數據空間計算強度的大小,對并行計算資源進行均衡的調度,有利于獲得更高的加速比。但現有的矢量空間計算強度預測模型主要以線性函數模型為主,考慮了部分矢量空間計算強度特征,但未考慮其它矢量空間計算強度特征的影響,且無法處理不同特征之間的交互影響。更重要的是,即便是使用優秀的隨機森林建模方法,也無法適應重要特征少、冗余特征多的矢量空間計算強度的精準預測,使得目前難以實現矢量空間計算強度的精準度量。
發明內容
本發明要解決的技術問題在于針對現有技術中的缺陷,提供一種基于完全隨機森林的矢量空間計算強度預測方法及系統,使用完全隨機森林來解決特征多且雜的矢量空間計算強度的精準預測,并且對預測結果進行了優化,提高了預測精度。
根據本發明的其中一方面,本發明為解決其技術問題,提供了一種基于完全隨機森林的矢量空間計算強度預測方法,包括以下步驟:
S1、獲取矢量空間計算強度原始樣本,每個矢量空間計算強度樣本中均包括以下13個類型的數值:矢量圖層包含的要素個數、要素幾何類型、數據庫類型、圖層空間范圍寬度、圖層空間范圍高度、空間計算域內要素個數、空間計算域內頂點數、窗口像素寬度、窗口像素高度、窗口地理寬度、窗口地理高度、容差半徑、計算時間;使用二維數組RawSamples[i][j]存儲矢量空間計算強度原始樣本集,RawSamples[i][j]表示第i個樣本第j個屬性值;
S2、使用整型隨機數生成器,生成N個大于等于0且小于N的整型數值,使用生成的N個整型數值,將其分別作為數組索引從原始樣本集的各個樣本中選取N個樣本作為新的樣本,將其存儲到二維數組TreeSamples[i][j]中;其中,N為原始樣本集中樣本數量;
S3、采用回歸決策樹訓練方法,利用步驟S2中得到的二維數組TreeSamples[i][j]進行訓練,建立回歸決策樹;
S4、循環執行S2至S3,直到獲得TN棵回歸決策樹,TN棵回歸決策樹構成了完全隨機森林FRF;其中TN為完全隨機森林中回歸決策樹的數量;
S5、獲取待預測的矢量空間計算強度樣本,每個待預測的矢量空間計算強度樣本包含以下12個類型的數值:矢量圖層包含的要素個數、要素幾何類型、數據庫類型、圖層空間范圍寬度,圖層空間范圍高度、空間計算域內要素個數、空間計算域內頂點數、窗口像素寬度,窗口像素高度、窗口地理寬度、窗口地理高度、容差半徑;使用一維數組NewSample存儲待預測樣本,NewSample[i]表示待預測樣本的第i個屬性值,將待預測的矢量空間計算強度樣本輸入到FRF中,調用FRF中的TN棵回歸決策樹的預測方法對待預測樣本的計算時間進行預測,獲得TN個預測結果,計算TN個預測結果的平均值AVG;
S6、分別計算TN棵回歸決策樹的預測結果與AVG之間的差值的絕對值,判斷該差值的絕對值是否大于AVG*R,其中R是預先設定的百分比,如果回歸決策樹的預測結果大于AVG*R,則將其剔除,反之保留;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國地質大學(武漢),未經中國地質大學(武漢)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711387102.3/2.html,轉載請聲明來源鉆瓜專利網。





