[發明專利]一種輕量級的缺失時空數據的重構方法有效
| 申請號: | 201910135946.1 | 申請日: | 2019-02-25 |
| 公開(公告)號: | CN109902259B | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 陸鋒;程詩奮;彭澎 | 申請(專利權)人: | 中國科學院地理科學與資源研究所 |
| 主分類號: | G06F17/16 | 分類號: | G06F17/16;G06F17/18;G06N3/04;G06N3/08 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 王雨桐 |
| 地址: | 100101 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 時空數據 重構 建模 算法 矩陣 平均相關系數 神經網絡模型 極限學習機 空間依賴性 時間依賴性 點狀數據 高斯函數 估計結果 計算效率 空間維度 缺失數據 時間窗口 時間維度 時空整合 時空狀態 數據抽象 學習算法 整體步驟 重構算法 自動選取 引入 時空維 整合 鄰居 參考 預測 賦予 改進 保證 統一 | ||
1.一種輕量級的缺失時空數據的重構方法,其特征在于:所述方法的整體步驟為:
步驟1、時空數據表示;
針對靜態參考的點狀數據和網狀數據,由于這兩種類型的數據的采樣過程在空間上是同步進行的,并按照相同的時間間隔進行預處理,它們具有空間靜態和時間動態的共同特點;因此,把它們抽象為統一的時空狀態矩陣來表示;
步驟2、時間維度插值;
引入平均相關系數來自動選取時間窗口以提高SES算法建模時間依賴性的能力;首先,以缺失數據所在的時間點為中心,分別選取向前和向后的時間點的樣本數據;然后,考慮到時空數據在較短的時間范圍內仍然保持近似的相關性,通過比較缺失數據所在的空間序列與其鄰近的空間序列之間的平均相關系數,來選取最優的滑動窗口;
步驟3、空間維度插值;
針對基于靜態參考的點狀數據和網狀數據這兩種不同的地理過程,分別采用基于高斯函數的恒等距離和相關性距離為每個空間鄰居賦予權重來提高經典的反向距離權重算法建模空間依賴性的能力,具體過程為:
針對靜態參考的點狀數據,在傳統的歐幾里得距離中引入相關系數,并利用高斯函數來平滑計算結果,從而構造一個恒等的距離函數;針對靜態參考的網狀數據,由于無法精確的描述兩個空間對象之間的物理距離,直接采用相關系數作為距離度量函數,以反映時空模式的變化;
其中,disti,k表示第i個空間對象和第k個空間對象的恒等距離,pdi,k表示兩個空間對象之間的物理距離,通過計算空間位置之間的歐幾里得距離來獲得;Ri,k表示第i個空間對象和第k個空間對象的相關系數;α為距離權重參數,利用真實數據來優化;通過計算缺失數據所在的時間序列和鄰近空間對象的時間序列的恒等距離和相關距離,分別選取pk和nk個最相關的候選樣本用于推斷缺失值;Cov(si,sk)用于計算Si、Sk兩個時間序列之間的協方差,D(si)、D(sk)用于計算時間序列的標準差;
其中,表示缺失數據在空間維度的估計值;vps,j和vns,j表示在選取的空間鄰近集合中的第ps和ns個空間鄰居在時間點j的觀測值,為距離衰減參數;disti,ps表示第i個空間對象和第ps個選擇的空間對象的恒等距離,Ri,ns表示第i個空間對象和第ns個選擇的空間對象的相關性距離;
步驟4、時空整合;
針對時間和空間維度獲取的插值結果,作為單隱層前饋神經網絡的輸入特征,同時引入極限學習機作為神經網絡模型的學習算法,整合時空維度的估計結果得到缺失數據最終的預測值。
2.根據權利要求1所述的輕量級的缺失時空數據的重構方法,其特征在于:所述步驟1的具體過程為:
假設采樣的空間對象的個數為M,歷史時間間隔長度為N,則時空狀態矩陣分別從空間維度和時間維度的視角表示,表示時空狀態矩陣,維度為M×N,表示實數集;
從空間維度的視角來看,表示第i個空間對象的歷史觀測時間序列,T表示轉置操作;
從時間維度的視角來看,表示第j個時間點的空間序列觀測值;
表示第i個空間對象在第j個時間間隔的觀測值,若則表示時空狀態矩陣中存在缺失值;時空數據的分離表示方式,方便從時間和空間維度分別建模,從而更好地抓取時空依賴性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院地理科學與資源研究所,未經中國科學院地理科學與資源研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910135946.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于區塊鏈的數據處理方法及設備
- 下一篇:三階多智能體系統的能控性判定方法





