[發明專利]基于斜率、截距和相關系數的距離測度方法無效
| 申請號: | 201110207407.8 | 申請日: | 2011-07-22 |
| 公開(公告)號: | CN102306299A | 公開(公告)日: | 2012-01-04 |
| 發明(設計)人: | 徐小軍;周國模;杜華強 | 申請(專利權)人: | 浙江農林大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 周烽 |
| 地址: | 311300 *** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 斜率 相關系數 距離 測度 方法 | ||
【技術領域】
本發明屬于數據計算和推算領域,具體是一種基于斜率、截距和相關系數的kNN(k-Nearest?Neighbor)算法的距離測度方法。
【背景技術】
kNN算法是一個理論上較成熟的方法,也是最簡單的機器學習算法之一,已被廣泛應用于分類、回歸和模式識別等領域中。訓練樣本的特征空間及研究對象稱為參照集。整個研究區的特征空間稱為目標集。在kNN算法中,距離測度起到非常重要的作用,是選擇目標集k個最近鄰參照集的工具。對于分類,如果一個目標在特征空間中的k個最近鄰的參照集大多數屬于某一個類別,則該目標就被判定為這個類別。對于回歸,通過距離測度找到一個目標的k個最近鄰參照集,將這些近鄰參照集的屬性以目標集與參照集之間距離倒數為權重進行加權平均,從而得到該目標的屬性。
森林資源連續清查是我國實施林業可持續發展重要保障。為了提高清查效率和精度,遙感技術、全球定位系統和地理信息系統技術被廣泛地應用于森林資源清查中。隨著調查技術和手段的提高,kNN算法作為一種非參數估算方法,能夠很好地與遙感影像結合,最先被用于芬蘭國家森林資源調查中并得到高度肯定。美國明尼蘇達大學(University?of?Minnesota)自然資源學院聯合其他機構開展kNN計劃,目的是研究利用衛星遙感資料、樣地調查和kNN算法調查美國的森林資源。可見,kNN算法是森林資源調查中常用的估算方法之一。
但是,kNN算法在像元級上的估算精度并不理想,具有較大的誤差。前人的研究已提出一些改進kNN算法的方法。例如,采用遺傳算法(Genetic?algorithm,GA)來優化最近鄰權重以及對最近鄰樣本重新排序和去偽最近鄰樣本;采用模糊距離(Fuzzy?Distance,FD)確定最近鄰樣本。
【發明內容】
鑒于距離測度在kNN算法中的重要地位。本發明提出一種新的距離測度,即采用參照集與目標集之間的回歸斜率、截距和相關系數來確定最近鄰樣本。當參照集與目標集高度相似時,兩者之間的回歸方程將逼近于y=x方程,即斜率、截距和相關系數分別越接近于1、0和1時,參照集與目標集越相似。
解決上述技術問題的技術方案是按如下步驟進行:
(1)確定特征空間,提取參照集和目標集:
根據樣地調查地理坐標,提取樣地的特征空間(美國陸地衛星5號專題制圖儀(Landsat?Thematic?Mapper,Landsat?TM)影像的1~5,7波段)并結合樣地森林調查因子屬性(胸徑、樹高、碳儲量等)構建參照集,將整個研究區影像特征空間作為目標集;(2)構造基于斜率、截距和相關系數距離測度(Slope,Intercept?and?Correlation?Distance,SICD):
a、計算參照集與目標集特征空間之間的線性回歸方程:
以目標集特征空間為自變量(y),參照集特征空間為因變量(x),通過最小二乘法建立目標集與每個參照集之間的回歸方程:
yi,l=axj,l+b+ε????????????????[1]
其中:yi,l為第i個目標集第l個特征空間,xj,l為第j個參照集第l個特征空間,a和b分別為斜率和截距,ε為殘差;
b、以三維空間點坐標表述SICD,即求[a,b,r]與[1,0,1]兩點之間的空間歐氏距離,為了消除a、b、r之間的尺度問題,分別對其進行歸一化處理,SICD計算公式:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江農林大學,未經浙江農林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110207407.8/2.html,轉載請聲明來源鉆瓜專利網。





