[發明專利]一種基于關鍵詞共現的管廊故障分析方法有效
| 申請號: | 201910323713.4 | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN110059319B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 孫華;華羅懿;蔣崢嶸;唐聰;金鳴;朱統權;陸理平 | 申請(專利權)人: | 上海化學工業區公共管廊有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/247;G06F40/242;G06F40/216;G06F16/34 |
| 代理公司: | 上海灣谷知識產權代理事務所(普通合伙) 31289 | 代理人: | 李曉星 |
| 地址: | 201507 上海市奉賢區化學*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關鍵詞 故障 分析 方法 | ||
1.一種基于關鍵詞共現的管廊故障分析方法,其特征在于,所述管廊故障分析方法包括以下步驟:
步驟一:構建以通用詞典為基礎并涵蓋管廊行業專有名詞及專業術語的自定義詞典;
步驟二:在得到故障信息后,對該故障信息進行故障信息預處理,所述故障信息預處理包括:
S2.1:故障信息去重:若所述故障信息中包含中文信息和英文信息,則將中文信息和英文信息進行比對去重,并對去重后的故障信息進行記錄;
S2.2:生成詞語集合:在所述自定義詞典中,對S2.1中記錄的去重后的故障信息利用分詞算法進行分詞并去除停用詞,將分詞并去除停用詞后的故障信息生成詞語集合;
步驟三:在得到所述詞語集合后,針對該詞語集合進行關鍵詞選取,所述關鍵詞選取包括:
S3.1:詞頻統計:針對S2.2中生成的詞語集合,統計該詞語集合中的每個詞語及其詞頻;
S3.2:同義詞合并:針對S3.1中的詞語集合中的詞語及其詞頻進行同義詞合并,并對合并的同義詞的詞頻進行相加;
S3.3:關鍵詞選取:在S3.2中的經過同義詞合并后的詞語集合中選取詞頻排名前M的詞語作為關鍵詞,其中M為正整數且M小于或者等于該關鍵詞的數量;
S3.4:關鍵詞詞云可視化:針對S3.3選出的關鍵詞進行詞云可視化;
步驟四:在對關鍵詞進行詞云可視化后,形成關鍵詞共現矩陣并將該關鍵詞共現矩陣可視化,包括:
S4.1:初始化共現矩陣:用N表示在S3.3中選擇的關鍵詞的數量,構建(N+1)*(N+1)的關鍵詞共現矩陣,并將該關鍵詞共現矩陣的首行和首列初始化為S3.3中選取的關鍵詞;
S4.2:關鍵詞共現頻次統計:將S4.1中的關鍵詞共現矩陣中首行的每個關鍵詞分別與首列的每個關鍵詞進行配對,形成關鍵詞對,在S3.2中的經過同義詞合并后的詞語集合中統計所述關鍵詞對的出現頻次,并將該出現頻次一一對應地統計入S4.1中的關鍵詞共現矩陣中;
S4.3:關鍵詞共現矩陣可視化:將S4.2中統計完關鍵詞對出現頻次的關鍵詞共現矩陣進行可視化;所述關鍵詞共現矩陣可視化的方式為形成關鍵詞共現網絡;所述關鍵詞共現網絡包括若干節點,每個所述節點分別代表一個S3.3中選取的關鍵詞,各個所述節點間通過無向邊進行連接以表達S4.2中的關鍵詞對間的關系,所述無向邊的顏色深淺及粗細與該關鍵詞對的出現頻次成正比;每個所述節點的大小與該節點的節點度成正比;
步驟五:最終根據所述節點的大小和/或所述無向邊的顏色深淺及粗細對管廊故障進行逐一判定排查。
2.如權利要求1所述的一種基于關鍵詞共現的管廊故障分析方法,其特征在于,所述S3.4中進行關鍵詞詞云可視化時,關鍵詞的大小與該關鍵詞的詞頻成正比。
3.如權利要求2所述的一種基于關鍵詞共現的管廊故障分析方法,其特征在于,針對所述關鍵詞共現網絡還將通過圖布局算法進行布局優化。
4.如權利要求3所述的一種基于關鍵詞共現的管廊故障分析方法,其特征在于,所述圖布局算法為力導向算法。
5.如權利要求4所述的一種基于關鍵詞共現的管廊故障分析方法,其特征在于,所述力導向算法為Fruchterman-Reingold算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海化學工業區公共管廊有限公司,未經上海化學工業區公共管廊有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910323713.4/1.html,轉載請聲明來源鉆瓜專利網。





