[發明專利]一種基于隨機森林的破碎山脊線關聯方法有效
| 申請號: | 201611203616.4 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106599931B | 公開(公告)日: | 2019-07-02 |
| 發明(設計)人: | 李安波;姚蒙蒙;王凱亮;李夢圓;陳楹 | 申請(專利權)人: | 南京師范大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06T17/05;G06T7/13 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210024 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隨機 森林 破碎 山脊 關聯 方法 | ||
1.一種基于隨機森林的破碎山脊線關聯方法,其特征在于該方法包括:
(1)針對山脊線數據,通過構建山脊線鄰接關系模型計算各山脊線的屬性數據;
(2)采用步驟(1)計算模型訓練區山脊線數據的屬性數據,并基于隨機森林方法,構建山脊線要否關聯的分類模型;
(3)采用步驟(1)計算工作區山脊線數據的屬性數據,并基于步驟(2)構建的分類模型,進行破碎山脊線的關聯處理;
其中,步驟(2)具體包括:
(2-1)采用步驟(1)計算得到模型訓練區山脊線數據的屬性數據Rt;
(2-2)從計算的屬性數據Rt中抽取訓練集Rt1和測試集Rt2:從Rt中,以無放回方式隨機抽取3/4樣本作為訓練集Rt1,另外1/4樣本作為測試集Rt2,得到:Rt1={ri4cj|i4=1,2,...,p,j=1,2,...,10},Rt2={ri4cj|i4=1,2,...,q,j=1,2,...,10},其中,ri4為行號,cj為列號,p和q分別為記錄條數;
(2-3)判別山脊線能否關聯:對Rt1、Rt2中的每一記錄分別增加屬性yi4,j,并對每條記錄的山脊線能否關聯進行判別,若能關聯,則對應的屬性yi4,j=1;反之,則yi4,j=0;
(2-4)自變量的標準化處理:對Rt1、Rt2中每個自變量列,以下面公式標準化處理;
式中,Xmax、Xmin分別為自變量列中的最大值和最小值,Xnorm表示自變量列X經標準化處理后的值;
(2-5)基于因變量的分類:將Rt1、Rt2中因變量yi4,j取值為1的記錄記入能關聯類can中,其余記錄記入不能關聯類cannot中;
(2-6)基于Rt1的cannot和can類,運用隨機森林分類方法,確定模型中決策樹每次分支時所選擇的變量個數mtry和最佳決策樹數量值tree,其中,mtry≤10;
(2-7)應用bootstrap算法有放回地從Rt1中隨機抽取tree個自助樣本集,并生成tree棵決策樹,確定最優隨機森林分類模型為:{h(Rt1,Θk),k=1,2,...,tree};其中,Θk表示第k棵決策樹,h()表示決策樹集,自助樣本生成決策樹的方法為:從自助樣本的全部10個自變量中等概率隨機抽取一包括mtry個自變量的自變量子集,再從該子集中選擇一個最優自變量來分裂節點,從而生成決策樹;
(2-8)計算模型準確度:將Rt2作為測試集,采用步驟(2-6)和(2-7)同樣對Rt2進行分類,并根據分類結果與Rt2數據的實際類別計算分類模型{h(Rt1,Θk),k=1,2,...,tree}的分類準確度pe,若模型準確度pe小于閾值,則通過調整試驗區或重新選取mtry、tree重復以上步驟來獲取新的模型;反之,表示模型可以使用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京師范大學,未經南京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611203616.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:虛擬現實空間定位特征點篩選方法
- 下一篇:一種基于多視角譜聚類的圖像識別方法





