[發(fā)明專利]基于源匯空間變量推理的土壤重金屬企業(yè)污染源識別方法有效
| 申請?zhí)枺?/td> | 201810239430.7 | 申請日: | 2018-03-22 |
| 公開(公告)號: | CN108595414B | 公開(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計)人: | 史舟;徐燁;賈曉琳;尤其浩 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06K9/62 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 空間 變量 推理 土壤 重金屬 企業(yè) 污染源 識別 方法 | ||
本發(fā)明公開了一種基于源匯空間變量推理的土壤重金屬企業(yè)污染源識別方法。首先獲取待研究區(qū)域的污染企業(yè)數(shù)據(jù)、企業(yè)POI數(shù)據(jù)與重金屬污染數(shù)據(jù),再對數(shù)據(jù)集的企業(yè)行業(yè)類別分布進(jìn)行調(diào)整,并在分詞處理剔除地方性的詞匯后分離出訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,然后根據(jù)這兩個數(shù)據(jù)集所建立的語料庫,統(tǒng)計各個樣本出現(xiàn)的詞的詞頻,作為該樣本對應(yīng)的文本特征,并且使用訓(xùn)練集的樣本來訓(xùn)練多項式樸素貝葉斯模型,通過測試集的評分來評估模型;最后根據(jù)獲取的企業(yè)數(shù)據(jù)預(yù)測行業(yè)分類與重金屬污染指數(shù)在根據(jù)研究區(qū)拓?fù)湫螤钌傻母窬W(wǎng)內(nèi)進(jìn)行數(shù)值統(tǒng)計,并使用雙變量空間自相關(guān)方法進(jìn)行空間分析,判斷污染與企業(yè)的空間分布關(guān)系,識別研究區(qū)內(nèi)的重金屬點源、面源污染區(qū)域。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于源匯空間變量推理的土壤重金屬企業(yè)污染源識別方法,具體涉及到一種基于特定文本挖掘手段的分類方法以及基于雙變量空間自相關(guān)分析方法。
技術(shù)背景
在現(xiàn)代工業(yè)化的發(fā)展下,一些不受監(jiān)管的企業(yè)肆意排放工業(yè)“三廢”,造成了嚴(yán)重的環(huán)境污染,其中土壤重金屬污染已經(jīng)成為了世界性的環(huán)境問題。據(jù)調(diào)查,全國土壤污染總超標(biāo)率為16.1%,污染類型主要以重金屬污染為主,對大約兩千萬公頃的農(nóng)田耕地造成了破壞。農(nóng)田土壤污染主要分為點源污染與面源污染,其中面源污染是指沒有固定的污染排放點通過土壤侵蝕、地表徑流等方式造成的土壤污染;點源污染有固定的排放污染源,具有可識別的范圍,相較于面源污染更容易管控治理,而企業(yè)污染屬于點源污染。目前已經(jīng)有許多土壤重金屬污染源解析的研究方法與模型,如王學(xué)松和秦勇(王學(xué)松,秦勇.徐州城市表層土壤中重金屬環(huán)境風(fēng)險測度與源解析[J].地球化學(xué),2006,35(1):88-94.)采用了因子分析與聚類分析的統(tǒng)計方法界定了研究區(qū)表層土壤中重金屬元素的來源和類別;Saby等(Saby N P,Thioulouse J,Jolivet C C,et al.Multivariate analysis of the spatialpatterns of 8trace elements using the French soil monitoring network data.[J].Science of the Total Environment,2009,407(21):5644-5652.)運用主成分分析法計算出研究區(qū)表層土壤中在自然因素與人為活動因素下的八種重金屬累積效應(yīng),并通過降維計算的方法將重金屬含量得到四個主成分,再根據(jù)穩(wěn)健地統(tǒng)計插值模型對主成分的得分進(jìn)行了空間插值的預(yù)測來得到重金屬的四個來源:土壤母質(zhì)、土壤質(zhì)地、土壤風(fēng)化與人為因素。但是這些源解析的方法或模型都有一定的缺陷,傳統(tǒng)的統(tǒng)計分析方法和化學(xué)方法如相關(guān)性分析法、主成分分析法、聚類分析法和因子分析法等都忽視了重金屬污染的空間位置信息,這對于土壤重金屬污染的防控的幫助相當(dāng)有限;而空間插值方法與傳統(tǒng)多元統(tǒng)計方法的結(jié)合沒有提供可靠的定量分析,對于污染的空間變異性也不能很好的解決。又由于企業(yè)造成的土壤重金屬污染的源頭與匯集的機(jī)理十分復(fù)雜,這使得目前企業(yè)污染的防控治理工作變得相當(dāng)艱難。對此,可以采用雙變量空間自相關(guān)模型(Moran’s I)來研究土壤重金屬污染狀況與企業(yè)分布之間的空間相關(guān)性,能夠?qū)ζ髽I(yè)污染的管控提供有效的指導(dǎo)與幫助。
但是,由于數(shù)據(jù)孤島現(xiàn)象的存在,跨部門間的數(shù)據(jù)合作難度大,部門間難以協(xié)作,企業(yè)信息的獲取難度相當(dāng)大。因此,可以采用一種基于特定文本挖掘手段的分類方法,通過企業(yè)的名稱來對污染企業(yè)的行業(yè)類別進(jìn)行識別,作為企業(yè)分布與污染分布間聯(lián)系的研究的基礎(chǔ)。文本分類在數(shù)據(jù)挖掘中是很重要的一種方法,其在一定量的已有數(shù)據(jù)的基礎(chǔ)上構(gòu)造一個分類函數(shù)或模型,再在具體的分類體系下將其它未知類別的文本數(shù)據(jù)通過具體的文本內(nèi)容指定到預(yù)定義的類別中。段煉(段煉.基于隨機(jī)詞匯迭代模型的POI分類檢索[J].計算機(jī)應(yīng)用研究,2014,31(10):3024-3027.)采用了隨機(jī)詞匯迭代模型對海量的興趣點即POI(Point of intrest)數(shù)據(jù)進(jìn)行文本分類。Zhang等(Zhang X,Zhao J,Lecun Y.Character-level Convolutional Networks for Text Classification[J].2015:649-657.)使用了字符級的卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行文本分類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810239430.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





