[發明專利]垃圾危機轉化智能管理方法在審
| 申請號: | 202010005056.1 | 申請日: | 2020-01-03 |
| 公開(公告)號: | CN111223026A | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 楊青;王鑫偉;蔡正浩;劉星星;劉恩源;王信歌;劉勝;李旻烜;陳夢婷;王同宇 | 申請(專利權)人: | 武漢理工大學 |
| 主分類號: | G06Q50/26 | 分類號: | G06Q50/26;G06K9/62;G06F16/951;G06F16/957 |
| 代理公司: | 武漢開元知識產權代理有限公司 42104 | 代理人: | 劉琳 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垃圾 危機 轉化 智能 管理 方法 | ||
本發明公開了一種垃圾危機轉化智能管理方法,包括:對網絡數據庫進行數據爬取;對步驟一中爬取到的文檔進行超文本標記語言處理、詞法相似度分析和詞表頻度處理;運用FCM聚類算法對步驟二中已經完成數據清洗和相似詞替換的案例向量化數據進行分析,將案例分成四類,構成名利空間下的決策支持模型;對歸類的數據進行余弦相似度分析,根據貝葉斯網絡模型對當前案例結構進行優化,演化出每一類的最優貝葉斯結構。本發明應用數據抓取、數據清洗和數據分析方法,交互友好,綜合運用人工智能的相關方法,文本處理過程流暢,為垃圾“鄰避”事件的解決提供了新的思路和參考建議,降低了決策難度,有很強的可行性。
技術領域
本發明屬于垃圾焚燒處理領域,涉及垃圾危機轉化智能管理方法及平臺系統。
背景技術
隨著城市化進程的推進,垃圾“鄰避”事件層出不窮,對社會穩定和垃圾焚燒行業發展產生了極其惡劣的影響。垃圾排放量大、占用社會資源多、污染生態環境的特點導致垃圾危機的產生。居民的“鄰避”心理給垃圾處理帶來了更大的困難。探究“鄰避”問題的解決方案成為了解除制約,進一步更快更好發展垃圾焚燒發電項目的迫切要求。
發明內容:
為了克服上述背景技術的缺陷,本發明提供一種垃圾危機轉化智能管理方法,因地制宜地提出建議供決策者參考,降低決策難度,為決策者提供解決“鄰避”問題的新思路。
為了解決上述技術問題本發明的所采用的技術方案為:
一種垃圾危機轉化智能管理方法,包括:
步驟一,對網絡數據庫進行數據爬取;
步驟二,對步驟一中爬取到的文檔進行超文本標記語言處理、詞法相似度分析和詞表頻度處理;
步驟三,運用FCM聚類算法對步驟二中已經完成數據清洗和相似詞替換的案例向量化數據進行分析,將案例分成四類,構成名利空間下的決策支持模型;對歸類的數據進行余弦相似度分析,根據貝葉斯網絡模型對當前案例結構進行優化,演化出每一類的最優貝葉斯結構。
較佳地,步驟一對網絡數據庫進行數據爬取包括:
使用Python在網絡數據庫爬取文件,基于關鍵詞表和停用詞表的標題分詞進行篩選,最后再通過超文本標記語言HTML結構篩選算法進行篩選,獲取作為本決策系統的案例庫。
較佳地,Python使用的相關庫包括scrapy、jieba、BeautifulSoup和chardet。
較佳地,超文本標記語言HTML結構篩選算法進行篩選的方法包括:先定義處理后的文檔的路徑,讀取內容過濾詞的文件,并寫入contentfilter_list過濾詞列表,完成數據初始化;去除網頁中的JavaScript和層疊樣式表鏈接,提取網頁中其它標簽的文本,完成超文本標記語言HTML結構處理;對每個標簽中的文本進行判斷,如果文本的長度小于設定長度或者文本中有contentfilter_list過濾詞列表的字符串就不取,否則添加進write_list列表;將每個html文件的write_list寫入txt文件中。
較佳地,設定長度為20。
較佳地,詞法相似度分析的方法包括:
利用Python的jieba庫對超文本標記語言HTML文件處理后的txt文件進行分詞并統計出現頻度最高的15個詞獲取需要比較的詞語、關鍵字;調用并初始化云AI平臺自然語言處理應用程序接口;利用自然語言處理應用程序接口相似度計算算法得到關鍵字與需要比較的詞匯的相似度,對相似度進行排序;把關鍵字和需要比較的詞的相似度寫入csv文件中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢理工大學,未經武漢理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010005056.1/2.html,轉載請聲明來源鉆瓜專利網。





