[發(fā)明專利]基于CART決策樹(shù)的水華預(yù)警方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201710501068.1 | 申請(qǐng)日: | 2017-06-27 |
| 公開(kāi)(公告)號(hào): | CN107301513A | 公開(kāi)(公告)日: | 2017-10-27 |
| 發(fā)明(設(shè)計(jì))人: | 劉云翔;吳浩;徐琛;李曉丹 | 申請(qǐng)(專利權(quán))人: | 上海應(yīng)用技術(shù)大學(xué) |
| 主分類號(hào): | G06Q10/06 | 分類號(hào): | G06Q10/06;G06Q50/26;G06K9/62 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司31236 | 代理人: | 胡晶 |
| 地址: | 200235 上海*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 cart 決策樹(shù) 預(yù)警 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及水環(huán)境保護(hù)技術(shù)領(lǐng)域,具體地,涉及基于CART決策樹(shù)的水華預(yù)警方法和裝置。
背景技術(shù)
由于大量城鎮(zhèn)污水和工農(nóng)業(yè)廢水流入江、河、湖泊等水體,使得水體的污染負(fù)荷不斷增加,造成水華事件頻發(fā)。為了更好的對(duì)富營(yíng)養(yǎng)化的水體進(jìn)行監(jiān)測(cè)和管理,許多研究者提出了通過(guò)建立水華預(yù)警模型來(lái)對(duì)水體的水華進(jìn)行預(yù)測(cè)。
決策樹(shù)(Classification And Regression Tree,CART)是1984年由Breiman、Friedman、Olshen、Stone提出的算法。CART算法采用一種二分遞歸分割的技術(shù),與基于信息熵的算法不同,CART算法對(duì)每次樣本集的劃分計(jì)算GINI系數(shù),其中,GINI系數(shù)是度量數(shù)據(jù)分區(qū)或者是樣本集E的不純程度,GINI系數(shù)越小則劃分越合理。CART算法總是將當(dāng)前樣本集分割為兩個(gè)子樣本集,使得生成的決策樹(shù)的每個(gè)非葉結(jié)點(diǎn)都只有兩個(gè)分枝。因此CART算法生成的決策樹(shù)是結(jié)構(gòu)簡(jiǎn)潔的二叉樹(shù)。CART決策樹(shù)既可以用來(lái)做分類樹(shù)也可以用來(lái)做回歸樹(shù)。但是,傳統(tǒng)的CART算法存在著計(jì)算量大和運(yùn)行時(shí)間長(zhǎng)的問(wèn)題。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種基于CART決策樹(shù)的水華預(yù)警方法和裝置。
第一方面,本發(fā)明提供一種基于CART決策樹(shù)的水華預(yù)警方法,包括:
選取K個(gè)影響水華的影響因子,分別計(jì)算所述K個(gè)影響因子與預(yù)設(shè)的決策屬性(葉綠素a濃度)之間的相關(guān)系數(shù);其中,K為大于0的整數(shù);
根據(jù)所述相關(guān)系數(shù)的值從K個(gè)影響因子中選取T個(gè)影響因子,所述T個(gè)影響因子作為影響水華的條件屬性,其中T為大于0且小于等于K的整數(shù);
基于Fayyad邊界點(diǎn)判定定理,獲取數(shù)據(jù)集中每個(gè)條件屬性對(duì)應(yīng)的GINI系數(shù);其中,所述數(shù)據(jù)集是指:從不同水體環(huán)境中檢測(cè)到的參數(shù)所構(gòu)成的數(shù)據(jù)集合;
根據(jù)所述GINI系數(shù)確定每個(gè)條件屬性的分割點(diǎn);
根據(jù)所述分割點(diǎn)和相關(guān)系數(shù)遞歸構(gòu)建決策樹(shù);
基于所述決策樹(shù)對(duì)水體進(jìn)行水華預(yù)警。
可選地,所述K個(gè)影響因子與預(yù)設(shè)的決策屬性之間的相關(guān)系數(shù)的計(jì)算公式如下:
式中:表示第i個(gè)條件屬性Ai與預(yù)設(shè)的決策屬性B之間的相關(guān)系數(shù),Ai表示第i個(gè)條件屬性,i為大于等于1且小于等于K的整數(shù),B表示預(yù)設(shè)的決策屬性,Cov(Ai,B)表示Ai與B的協(xié)方差,D(Ai)表示Ai的方差,D(B)表示B的方差。
可選地,所述基于Fayyad邊界點(diǎn)判定定理,獲取數(shù)據(jù)集中每個(gè)條件屬性對(duì)應(yīng)的GINI系數(shù),包括:
假設(shè)根據(jù)任一條件屬性A將所述數(shù)據(jù)集E劃分為兩個(gè)子集E1和E2,則所述條件屬性A對(duì)應(yīng)數(shù)據(jù)集E的GINI系數(shù)的計(jì)算公式如下:
其中:
式中:GINIA(E)表示E在A屬性下的基尼指數(shù),表示子集E1在集合E中的比例,GINI(E1)表示E1的基尼指數(shù),表示子集E2在集合E中的比例,GINI(E2)表示E2的基尼指數(shù),GINI(E)表示E的基尼指數(shù),pi表示E中元組屬于決策屬性最終分類結(jié)果的概率,m表示決策屬性數(shù)據(jù)集分類的個(gè)數(shù)。
可選地,所述根據(jù)所述GINI系數(shù)確定每個(gè)條件屬性的分割點(diǎn),包括:
根據(jù)GINI系數(shù)最小原則來(lái)為每個(gè)條件屬性獲取分割點(diǎn),所述GINI系數(shù)最小原則是指當(dāng)基于任一條件屬性將所述數(shù)據(jù)集分割成兩個(gè)子集時(shí),使得所述條件屬性關(guān)于所述數(shù)據(jù)集的GINI系數(shù)最小;
將所述GINI系數(shù)最小時(shí)的分割點(diǎn)作為所述條件屬性的分割點(diǎn)。
可選地,所述根據(jù)所述分割點(diǎn)和相關(guān)系數(shù)遞歸構(gòu)建決策樹(shù),包括:
A1:選取數(shù)據(jù)集中相關(guān)系數(shù)最大的條件屬性作為第1層的節(jié)點(diǎn);將所述條件屬性作為根節(jié)點(diǎn);
A2:令N的初始值為1;
A3:根據(jù)所述N層節(jié)點(diǎn)的條件屬性對(duì)應(yīng)的分割點(diǎn)確定位于第N+1層的數(shù)據(jù)子集,所述N+1層的數(shù)據(jù)子集中相關(guān)系數(shù)最大的條件屬性作為第N+1層的節(jié)點(diǎn);
A4:判斷位于第N+1層的數(shù)據(jù)子集是否存在可分割的條件屬性,若存在可分割的條件屬性,則令N的值自增1,返回執(zhí)行A3,若不存在可分割的條件屬性,則執(zhí)行A5;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海應(yīng)用技術(shù)大學(xué),未經(jīng)上海應(yīng)用技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710501068.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 一種CART多肽化合物及其制備方法和應(yīng)用
- 一種混合CART細(xì)胞的制備方法和應(yīng)用
- 一種等比例混合兩種靶點(diǎn)CART細(xì)胞的制備方法及應(yīng)用
- 混合CD19和CD22靶點(diǎn)CART細(xì)胞的制備方法
- 聯(lián)合表達(dá)Treg抑制劑P60的CAR-T細(xì)胞的制備
- P60抑制劑與cart細(xì)胞聯(lián)合應(yīng)用
- 一種基于CART算法的油氣回收方法
- 促實(shí)體瘤浸潤(rùn)的增強(qiáng)型CART細(xì)胞及其制備方法和細(xì)胞藥物
- 一種基于XGBoost算法的鋰電池剩余壽命預(yù)測(cè)方法
- 基于CART回歸樹(shù)的路感模擬方法
- 一種過(guò)濾無(wú)效監(jiān)控報(bào)警信息的方法及其裝置
- 一種自動(dòng)獲取預(yù)警對(duì)象的方法及裝置
- 一種風(fēng)險(xiǎn)預(yù)警方法及裝置
- 監(jiān)控系統(tǒng)及監(jiān)控方法
- 自動(dòng)生成調(diào)度安全監(jiān)督工作預(yù)警的方法及系統(tǒng)
- 基于北斗衛(wèi)星的預(yù)警信息發(fā)布系統(tǒng)及發(fā)布方法
- 一種山洪災(zāi)害監(jiān)測(cè)預(yù)警平臺(tái)
- 指標(biāo)預(yù)警方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于預(yù)警識(shí)別的預(yù)警異常處理方法和系統(tǒng)
- 一種預(yù)警系統(tǒng)





