[發明專利]垃圾危機轉化智能管理方法在審
| 申請號: | 202010005056.1 | 申請日: | 2020-01-03 |
| 公開(公告)號: | CN111223026A | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 楊青;王鑫偉;蔡正浩;劉星星;劉恩源;王信歌;劉勝;李旻烜;陳夢婷;王同宇 | 申請(專利權)人: | 武漢理工大學 |
| 主分類號: | G06Q50/26 | 分類號: | G06Q50/26;G06K9/62;G06F16/951;G06F16/957 |
| 代理公司: | 武漢開元知識產權代理有限公司 42104 | 代理人: | 劉琳 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垃圾 危機 轉化 智能 管理 方法 | ||
1.一種垃圾危機轉化智能管理方法,其特征在于,包括:
步驟一,對網絡數據庫進行數據爬取;
步驟二,對步驟一中爬取到的文檔進行超文本標記語言處理、詞法相似度分析和詞表頻度處理;
步驟三,運用FCM聚類算法對步驟二中已經完成數據清洗和相似詞替換的案例向量化數據進行分析,將案例分成四類,構成名利空間下的決策支持模型;對歸類的數據進行余弦相似度分析,根據貝葉斯網絡模型對當前案例結構進行優化,演化出每一類的最優貝葉斯結構。
2.根據權利要求1所述的一種垃圾危機轉化智能管理方法,其特征在于,所述步驟一對網絡數據庫進行數據爬取包括:
使用Python在網絡數據庫爬取文件,基于關鍵詞表和停用詞表的標題分詞進行篩選,最后再通過超文本標記語言HTML結構篩選算法進行篩選,獲取作為本決策支持系統的案例庫。
3.根據權利要求2所述的一種垃圾危機轉化智能管理方法,其特征在于:Python使用的相關庫包括scrapy、jieba、BeautifulSoup和chardet。
4.根據權利要求2所述的一種垃圾危機轉化智能管理方法,其特征在于,超文本標記語言HTML結構篩選算法進行篩選的方法包括:先定義處理后的文檔的路徑,讀取內容過濾詞的文件,并寫入contentfilter_list過濾詞列表,完成數據初始化;去除網頁中的腳本編程語言JavaScript和層疊樣式表鏈接,提取網頁中其它標簽的文本,完成超文本標記語言HTML結構處理;對每個標簽中的文本進行判斷,如果文本的長度小于設定長度或者文本中有contentfilter_list過濾詞列表的字符串就不取,否則添加進write_list列表;將每個html文件的write_list寫入txt文件中。
5.根據權利要求4所述的一種垃圾危機轉化智能管理方法,其特征在于:所述設定長度為20。
6.根據權利要求4所述的一種垃圾危機轉化智能管理方法,其特征在于,詞法相似度分析的方法包括:
利用Python的jieba庫對超文本標記語言HTML文件處理后的txt文件進行分詞并統計出現頻度最高的15個詞獲取需要比較的詞語、關鍵字;調用并初始化云AI平臺自然語言處理應用程序接口;利用自然語言處理應用程序接口相似度計算算法得到關鍵字與需要比較的詞匯的相似度,對所述相似度進行排序;把關鍵字和需要比較的詞的相似度寫入csv文件中。
7.根據權利要求6所述的一種垃圾危機轉化智能管理方法,其特征在于,構建鄰避CRN網絡進行詞表頻度處理,具體方法包括:
對超文本標記語言HTML處理后的txt文件進行依次讀取,利用jieba對文本進行分詞處理,寫入csv文件中;把詞法相似度分析中讀取的所有詞的詞頻全部寫入一個csv文件中;利用詞法相似度表的數據對全部詞頻的csv文件進行詞匯的替換;將詞頻矩陣進行奇異值分解得到每個詞的奇異值和每個文本對應的奇異向量,得到關鍵詞-關鍵詞語義距離表表和文本-關鍵詞語義距離表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢理工大學,未經武漢理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010005056.1/1.html,轉載請聲明來源鉆瓜專利網。





