[發明專利]一種新的數據空間離散化算法在審
| 申請號: | 202110176659.2 | 申請日: | 2021-02-07 |
| 公開(公告)號: | CN113190794A | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 趙銀軍;李家旭;丁愛中;鄧齊玉;童凱;莫莉萍 | 申請(專利權)人: | 廣西中青態環境科技有限公司;南寧師范大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06Q10/06 |
| 代理公司: | 重慶為信知識產權代理事務所(普通合伙) 50216 | 代理人: | 李曉賢 |
| 地址: | 530031 廣西壯族自治區南*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 空間 離散 算法 | ||
本發明涉及空間數據轉換技術領域,具體為一種新的數據空間離散化算法,包括初始化候選斷點、確定最優候選斷點集、確定最優區間數、連續屬性離散化等步驟。本算法通過將空間數據的空間特征引入到空間數據的離散化過程中,且兼顧了空間數據的空間特征和屬性特征,與現有的離散化算法相比,是一種專門針對地理探測器模型并且充分考慮空間特征的數據離散化算法,彌補傳統數據離散化算法的不足且大幅提升了地理探測器q值的精準度,為科研人員準確找出哪些風險因子對實驗結果的影響更大提供了有利條件。
技術領域
本發明涉及空間數據轉換技術領域,具體為一種新的數據空間離散化算法。
背景技術
地理探測器模型是基于空間分層異質性原理來揭示空間分異性背后的驅動因子。現在許多學者將該模型應用于生態環境、區域經濟、土地利用、旅游、氣象等領域的研究,然而這些領域還有許多如環境因子、社會經濟因子等連續型因子數據,例如溫度、降水、植被覆蓋度、高程、坡度、人口、旅游業總收入等,而地理探測器模型擅長處理的是離散類型因子數據,例如土壤類型、土地利用類型、植被類型、流域類型等,所以連續型因子數據作為空間數據就需要通過數據離散化算法轉換為離散型空間數據之后才能導入地理探測器模型進行分析。
現在常用的數據離散化算法有自然斷點法、等間距法、幾何斷點法、分位數法、標準差距離法等,這些算法雖然也能夠用于空間數據屬性特征的離散化,但均未考慮空間數據的空間特征以及空間實體之間的相關性,空間實體所形成格局的空間分異性,而且各種算法也有各自最適合應用的技術領域,比如分位數法適用于樣本容量較大且樣本呈線性分布的情況,目前來講醫學領域應用較多,幾何斷點法是專門為制圖而設計的一種數據離散化算法,等間距法對于服從正態分布的數據,該算法效果較好。
目前針對地理探測器模型并且考慮空間特征的數據離散化算法的研究很少,因此從空間數據表現出的空間特征出發,專門為地理探測器模型設計一種空間數據離散化算法,一是能有效彌補傳統數據離散化算法的不足,二是能達到提升地理探測器模型精度并降低其應用過程中的不確定性的目的。
發明內容
本發明一種新的數據空間離散化算法,包括初始化候選斷點、確定最優候選斷點集、確定最優區間數、連續屬性離散化等步驟,其將空間數據的空間特征引入到空間數據的離散化過程中,同時兼顧了空間數據的空間特征和屬性特征,與傳統的離散化算法相比,是一種專門針對地理探測器模型并且充分考慮空間特征的數據離散化算法,彌補傳統數據離散化算法的不足且提升了地理探測器q值的精準度,有效解決了上述問題。
本發明采用的技術方案:
1、一種新的數據空間離散化算法,其特征在于,包括以下步驟:
(Ⅰ)初始化候選斷點:輸入已經處理好的空間數據,指定需要離散化的連續屬性,對連續屬性的所有取值進行數據預處理,得到候選斷點集合;
(Ⅱ)確定最優候選斷點集:包括候選區間分割和搜索莫蘭指數最優斷點兩個步驟,根據疊置斷點法,用候選斷點將連續屬性取值集合分割為左右兩個區間,分別計算分割后左右兩個區間的平均值,再用左右區間各自的平均值代替各自區間的所有屬性的取值,則空間數據的連續屬性取值集合只包含左右區間的兩個平均值,然后計算集合的全局莫蘭指數,取莫蘭指數最大值對應的分割點作為最優離散化斷點,再將分割后的左右區間重復上述過程直至滿足疊置斷點法的終止條件,最后收集所有最優候選斷點,得到最優候選斷點集合;
(Ⅲ)確定最優區間數:對于最優候選斷點集合,經增量組合最優斷點、區間數PD值序列匹配、滑動計算區間比值后可確定最優區間數,即根據每個斷點分割的區間長度進行降序排序,將集合中的第一個點作為起點,每次從起點開始增量截取斷點,直到從起點截取至最后一個斷點,得到與最優斷點集合的長度相同的斷點組合的集合,計算集合中每個斷點組合的因子探測值,按照斷點組合長度的降序順序構造與其對應的因子探測值的序列,計算因子探測值與區間長度的比值,由前向后查找,如果遇到后面比值小于前面比值的,則前面位置對應的組合長度值加一為最優區間數,對應的斷點組合為最優斷點集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西中青態環境科技有限公司;南寧師范大學,未經廣西中青態環境科技有限公司;南寧師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110176659.2/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





