[發明專利]基于不平衡修正半監督學習的道邊空氣污染預測方法有效
| 申請號: | 201811541675.1 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109657858B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 佘青山;吳啟凡;蔣鵬;席旭剛;林宏澤 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/0637;G06Q50/26;G06N20/00 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 不平衡 修正 監督 學習 空氣污染 預測 方法 | ||
1.基于不平衡修正半監督學習的道邊空氣污染預測方法,其特征在于步驟如下:
S1:獲取道邊空氣監測站點的歷史污染物數據;
S2:對歷史污染物數據進行預處理,并且劃分為訓練集和測試集;
S3:采用帶多數類權重的少數類過采樣技術對訓練集中的有標記的污染物數據進行不平衡修正;
S4:將經過不平衡修正的有標記污染物數據和無標記污染物數據作為輸入,訓練SSELM模型;
S5:將測試集數據輸入到道邊空氣污染預測模型中,即可得到預測結果;
其中步驟S3的具體步驟包括:
S31:有標記污染物樣本Xl中按照樣本數目的多少,分為少數類樣本集和多數類樣本集
S32:計算少數類樣本集中每個樣本的k1最近鄰集,其中屬于少數類的記為Setmin;
S33:去掉少數類樣本集中的噪聲樣本并記為其中噪聲樣本是最近鄰集中只有多數類沒有少數類的樣本;
S34:在少數類樣本集中,根據歐式距離計算每個樣本的k2多數類最近鄰,并記為Setmaj,表示決策邊界的多數類樣本集;
S35:在樣本集Setmaj中,根據歐式距離計算每個樣本的k3少數類最近鄰,并記為Setrep,表示少數類中的代表性樣本;
S36:計算每一個屬于Setrep的樣本到決策邊界數據集Setmaj的距離,根據距離大小分配權值,該權值決定了該樣本被選到去合成新樣本的概率;權值計算公式如下:
其中
num_min為Setrep樣本集的數量,L(max)表示Setmaj中的樣本,num_max表示整個樣本集的數量;
S37:利用Setrep中的樣本,在樣本之間利用線性插值法生成少數類樣本,公式如下:
s=x+α(y-x)
其中s表示新生成的少數類樣本,α是0和1之間的隨機數,y是x的近鄰樣本;
S38:將這些新生成的少數類樣本與少數類樣本集和多數類樣本集Xl-合并成新的有標記污染樣本集X′l;
其中步驟S4的具體步驟為:
S41:利用步驟S3更新過的有標記樣本集和無標記樣本集作為SSELM模型的輸入,并計算圖的拉普拉斯算子L;
S42:根據隨機的輸入層權值ω和隱含層偏置b,初始化具有m個隱含層結點的ELM神經網絡,設激活函數為g(x),計算隱含層輸出矩陣H;
H=g(ωx+b)
S43:設置權衡參數C和λ;
S44:根據SSELM模型的目標函數,求得輸出層權值矩陣β;其中目標函數表示為:
其中是為結構風險項,為經驗風險項,Tr(g)表示矩陣的跡,F為實際輸出矩陣,yi為對應樣本xi的期望輸出,ei對應樣本xi的訓練誤差;
S35:求解隱含層輸出權值矩陣解;
當輸入樣本集X′l的個數l′+u大于隱含層節點個數m時,目標函數的解為β=(I+CHTH+λHTLH)-1CHTT;當輸入樣本集X′l的個數l′+u小于隱含層節點個數m時,解為β=HT(I+CHTH+λHTLH)-1CT,返回f(x)=h(x)β;其中,I為單位矩陣,T為期望輸出矩陣。
2.如權利要求1所述的基于不平衡修正的半監督道邊空氣污染預測方法,其特征在于,步驟S1中歷史污染物包括二氧化氮、二氧化硫、一氧化碳和懸浮微粒。
3.如權利要求1所述的基于不平衡修正的半監督道邊空氣污染預測方法,其特征在于,步驟S2中對歷史污染物數據進行預處理包括缺失值處理和歸一化處理。
4.如權利要求1所述的基于不平衡修正的半監督道邊空氣污染預測方法,其特征在于,步驟S3中有標記樣本是指提前分好污染等級的樣本,無標記樣本是指未提前分好污染等級的樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811541675.1/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





