[發明專利]一種基于主動學習和克里金插值的空氣質量推測算法在審
| 申請號: | 201811468938.0 | 申請日: | 2018-12-04 |
| 公開(公告)號: | CN109753631A | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 於志文;?;劬?/a>;郭斌;王亮 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06F17/17 | 分類號: | G06F17/17;G06F17/16;G06F17/18 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 劉新瓊 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 金插 主動學習 置信度 采樣 算法 預估 數據預測 監測站 走勢 市政 融合 | ||
1.一種基于主動學習和克里金插值的空氣質量推測算法,其特征在于步驟如下:
步驟1:利用空氣質量監測站收集空氣中各污染物濃度信息數據,將數據整理成四元組<監測站id,監測站位置,檢測時間,空氣質量指數>的格式;原始數據表示為(station_id,time,PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration),其中station_id代表監測站id,time代表所監測的污染物濃度信息的時間,(PM25_Concentration,PM10_Concentration,NO2_Concentration,CO_Concentration,O3_Concentration,SO2_Concentration)代表空氣中懸浮顆粒物,二氧化氮,一氧化碳,臭氧,二氧化硫污染物濃度;
步驟2:分別針對五種空氣污染物濃度數據使用公式計算得到5個I值,取最大的I值為空氣質量指數,即AQI;C為污染物濃度;Cl、Ch為該污染物濃度限值,Il、Ih為對應的AQI限值,4個數均為常量,可通過查閱空氣質量指數及對應的污染物濃度限值表獲得;
表1空氣質量指數及對應的污染物濃度限值
步驟3:計算各空氣監測站距離之間的半方差,衡量各監測站之間的空間相關程度即半變異函數,計算公式如下:
其中h為各監測站之間距離,n是由h分開的成對樣本的數量,z(xi)是第i個監測站的空氣質量指數,z(xi+h)為與監測站xi距離為h得監測站的空氣質量指數值;
步驟4:將監測站分為兩部分,收集了空氣質量數據的監測站為標記樣本,即已知點,其余未收集空氣質量數據的監測站為未標記樣本,即未知點,利用收集到的監測站數據以及根據監測站之間的距離與半方差之間的關系所擬合的模型對未標記樣本進行插值估算,估算公式如下:
其中z0為未標記樣本的AQI估計值,為標記樣本的AQI值,s是用來估算未知點的已知點的數目,為各在估計時影響大小的系數,由以下方程組計算:
其中γ(xi,xj)為xi與xj之間的半變異函數值,μ為拉格朗日常數;
步驟5:采用以下公式作為對所插數據的預估誤差作為置信度評判的指標:
MSE(Z0)=σ2{1-rTR-1r+(1-FR-1r)2/FTR-1F}
其中σ2為方差,R稱為相關矩陣,由所有已知樣本點之間的半變異函數值組成,r稱為相關矢量,由未知點與所有已知樣本點之間的半變異函數值組成,計算公式如下:
F=[1 ... 1]T
步驟6:直接選擇對未收集數據的監測站預估值誤差最大的點為置信度最低的未標記樣本,從插值結果中選擇滿足置信度要求的未標記樣本并主動收集該監測站數據,加入到標記樣本集中,并從未標記樣本集中去除該樣本;
步驟7:重新訓練克里金插值模型,直至滿足精度要求、成本要求或數量要求為止;此時已選取最少的位置對空氣質量進行采樣并最大程度準確地推測出了其他位置的空氣質量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811468938.0/1.html,轉載請聲明來源鉆瓜專利網。





