[發(fā)明專利]基于不平衡修正半監(jiān)督學(xué)習(xí)的道邊空氣污染預(yù)測方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811541675.1 | 申請(qǐng)日: | 2018-12-17 |
| 公開(公告)號(hào): | CN109657858B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計(jì))人: | 佘青山;吳啟凡;蔣鵬;席旭剛;林宏澤 | 申請(qǐng)(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q10/0637;G06Q50/26;G06N20/00 |
| 代理公司: | 浙江千克知識(shí)產(chǎn)權(quán)代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 不平衡 修正 監(jiān)督 學(xué)習(xí) 空氣污染 預(yù)測 方法 | ||
本發(fā)明公開了一種基于不平衡修正半監(jiān)督學(xué)習(xí)的道邊空氣污染預(yù)測方法。本發(fā)明包括以下步驟:(1)獲取道邊空氣監(jiān)測站點(diǎn)的歷史污染物數(shù)據(jù)。(2)對(duì)歷史污染物數(shù)據(jù)進(jìn)行預(yù)處理,并且劃分為訓(xùn)練集和測試集。(3)采用帶多數(shù)類權(quán)重的少數(shù)類過采樣技術(shù)對(duì)訓(xùn)練集中的有標(biāo)記污染物數(shù)據(jù)進(jìn)行不平衡修正。(4)將經(jīng)過不平衡修正的有標(biāo)記污染物數(shù)據(jù)和無標(biāo)記污染物數(shù)據(jù)作為輸入,訓(xùn)練半監(jiān)督超限學(xué)習(xí)機(jī)模型。(5)將測試集數(shù)據(jù)輸入到道邊空氣污染預(yù)測模型中,即可得到預(yù)測結(jié)果。本發(fā)明基于類別不平衡數(shù)據(jù)處理算法和半監(jiān)督學(xué)習(xí)技術(shù),考慮了污染物數(shù)據(jù)的不平衡性、缺少標(biāo)記這一特性,提高了道邊監(jiān)測站點(diǎn)空氣污染預(yù)測精度。
技術(shù)領(lǐng)域
本發(fā)明涉及空氣污染預(yù)測技術(shù)領(lǐng)域,尤其是涉及一種基于不平衡修正半監(jiān)督學(xué)習(xí)的道邊空氣污染預(yù)測方法。
背景技術(shù)
隨著中國工業(yè)化、城市化進(jìn)程的不斷加速,機(jī)動(dòng)車保有量迅猛增長,移動(dòng)污染源排放總量增加,逐漸成為城市空氣污染的主要來源。機(jī)動(dòng)車尾氣的主要污染物包含CO、HC、NOx、PM,人體吸入這些有害氣體,會(huì)增加患呼吸和心血管的疾病的風(fēng)險(xiǎn),這些污染對(duì)人體健康有很大影響。因此,為了控制機(jī)動(dòng)車排放、改善區(qū)域空氣質(zhì)量,需要了解移動(dòng)污染源對(duì)道邊的污染情況,預(yù)測監(jiān)測站點(diǎn)周圍的空氣質(zhì)量。
目前,空氣污染預(yù)測方法主要分為:
(1)污染物擴(kuò)散模式模擬計(jì)算方法
這類方法通常基于經(jīng)驗(yàn)假設(shè),根據(jù)污染物擴(kuò)散、遷移及轉(zhuǎn)換規(guī)律,模擬出一個(gè)計(jì)算公式。需要對(duì)污染物的形成和來源有充分的理解,得到的模型復(fù)雜,計(jì)算量大。且不同的道路建立的預(yù)測模型都不一樣,具有局限性。
(2)基于機(jī)器學(xué)習(xí)的預(yù)測方法
這類方法是由數(shù)據(jù)驅(qū)動(dòng)的,不模擬排放和污染物之間的物理模型,主要依賴于傳感器監(jiān)測到的氣象數(shù)據(jù)和污染物數(shù)據(jù)。常用的有人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹等。雖然這類機(jī)器學(xué)習(xí)模型在空氣污染預(yù)測上取得了不錯(cuò)的效果,但也存在如下問題:不同空氣質(zhì)量等級(jí)的數(shù)據(jù)存在非常大的不平衡性,例如,某個(gè)監(jiān)測站點(diǎn)的空氣質(zhì)量等級(jí)為1級(jí)的樣本有80個(gè),2級(jí)的樣本只有20個(gè)。即使所有樣本都預(yù)測為空氣質(zhì)量1級(jí),正確率依然可以達(dá)到80%,而對(duì)2級(jí)的預(yù)測準(zhǔn)確率為0%。這樣的預(yù)測模型是不符合實(shí)際的。傳統(tǒng)的基于機(jī)器學(xué)習(xí)的污染預(yù)測方法假設(shè)有標(biāo)記污染樣本充足,未考慮到大比例的無標(biāo)記污染樣本。如何利用有標(biāo)記樣本和無標(biāo)記樣本,提高預(yù)測模型性能,引到了廣泛的關(guān)注。
發(fā)明內(nèi)容
本發(fā)明克服現(xiàn)有技術(shù)的不足,提供一種基于不平衡修正半監(jiān)督學(xué)習(xí)的道邊空氣污染預(yù)測方法,在考慮到數(shù)據(jù)類別不平衡性的同時(shí),結(jié)合半監(jiān)督學(xué)習(xí)建立預(yù)測模型,提高了模型的實(shí)用性和預(yù)測性能。
本發(fā)明技術(shù)解決方案:
一種基于不平衡修正半監(jiān)督學(xué)習(xí)的道邊空氣污染預(yù)測方法,該方法具體包括以下步驟:
S1:獲取道邊空氣監(jiān)測站點(diǎn)的歷史污染物數(shù)據(jù)X。
進(jìn)一步,在步驟S1中,包括:
歷史污染物數(shù)據(jù)X包括有標(biāo)記污染物樣本Xl和無標(biāo)記污染物樣本Xu。有標(biāo)記污染物樣本Xl為提前分好污染等級(jí)的樣本,無標(biāo)記污染物樣本Xu為未提前分好污染等級(jí)的樣本。
S2:對(duì)歷史污染物數(shù)據(jù)進(jìn)行預(yù)處理,并且劃分為訓(xùn)練集和測試集。
進(jìn)一步,在步驟S2中,對(duì)歷史污染物數(shù)據(jù)的預(yù)處理包括缺失值處理和歸一化處理。
S3:采用帶多數(shù)類權(quán)重的少數(shù)類過采樣技術(shù)(Majority?Weighted?MinorityOversampling?Technique,MWMOTE)對(duì)訓(xùn)練集中的有標(biāo)記污染物數(shù)據(jù)進(jìn)行不平衡修正。
進(jìn)一步,在步驟S3中,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811541675.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





