[發明專利]一種基于關鍵詞共現的管廊故障分析方法有效
| 申請號: | 201910323713.4 | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN110059319B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 孫華;華羅懿;蔣崢嶸;唐聰;金鳴;朱統權;陸理平 | 申請(專利權)人: | 上海化學工業區公共管廊有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/247;G06F40/242;G06F40/216;G06F16/34 |
| 代理公司: | 上海灣谷知識產權代理事務所(普通合伙) 31289 | 代理人: | 李曉星 |
| 地址: | 201507 上海市奉賢區化學*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關鍵詞 故障 分析 方法 | ||
本發明公開了一種基于關鍵詞共現的管廊故障分析方法,包括以下步驟:步驟一:構建以通用詞典為基礎并涵蓋管廊行業專有名詞及專業術語的自定義詞典;步驟二:在得到故障信息后,對該故障信息進行故障信息預處理;步驟三:在得到詞語集合后,針對該詞語集合進行關鍵詞選取;步驟四:在對關鍵詞進行詞云可視化后,形成關鍵詞共現矩陣并將該關鍵詞共現矩陣可視化。本發明通過自定義詞典、詞頻統計的手段發現故障關鍵詞,并通過關鍵詞詞云可視化進行展示;進一步地構建關鍵詞共現網絡,并采用圖布局算法進行布局優化,以達到對故障信息的分析和直觀展示。
技術領域
本發明涉及一種基于關鍵詞共現的管廊故障分析方法。
背景技術
文本分析技術是指對文本的表示及其特征項的選取,是文本挖掘、信息檢索中的基本問題。它將無結構的原始文本轉化為結構化的計算機可以識別和處理的信息,從而建立數學模型來描述和代替文本,最終實現從大量文本中挖掘有效信息的目的。關鍵詞共現網絡分析也叫共詞分析,是一種文本內容分析技術,它通過分析在同一個文本主題中單詞或名詞短語共同出現的形式,揭示關鍵詞間的親疏關系,共現頻次越高,說明兩個關鍵詞之間的相關性越強。
圖布局算法是解決大規模節點連接圖中布局雜亂、可讀性差等問題的算法。力導引布局算法是其經典方法,主要思想是將整個拓撲圖看作一個物理系統,相鄰頂點之間存在引力,不相鄰的頂點間存在斥力,每次迭代計算頂點受到的合力,并根據合力移動頂點,最終使整個系統達到一個能量的極小值。通過傳統的力導引布局算法可以產生邊長和頂點分布較均勻的符合美學標準的圖布局結果,代表性的算法有Fruchterman等人的FR(Fruchterman-Reingold)算法。
現有的管廊故障信息尚未得到有效利用,管理者通常無法迅速對管廊故障的類型、地點等內容進行判斷,無法有效開展對管廊的針對性檢修工作,因此管廊的故障檢修工作通常需要動用大量的工作人員進行逐步排查,耗時耗力,大大影響了工作效率,提高了企業的成本。
發明內容
本發明的目的,就是為了解決上述問題而提供了一種基于關鍵詞共現的管廊故障分析方法,能對故障信息進行分析并直觀展示。
本發明的目的是這樣實現的:
本發明的一種基于關鍵詞共現的管廊故障分析方法,包括以下步驟:
步驟一:構建以通用詞典為基礎并涵蓋管廊行業專有名詞及專業術語的自定義詞典;
步驟二:在得到故障信息后,對該故障信息進行故障信息預處理,故障信息預處理包括:
S2.1:故障信息去重:若故障信息中包含中文信息和英文信息,則將中文信息和英文信息進行比對去重,并對去重后的故障信息進行記錄;
S2.2:生成詞語集合:在自定義詞典中,對S2.1中記錄的去重后的故障信息利用分詞算法進行分詞并去除停用詞,將分詞并去除停用詞后的故障信息生成詞語集合;
步驟三:在得到詞語集合后,針對該詞語集合進行關鍵詞選取,關鍵詞選取包括:
S3.1:詞頻統計:針對S2.2中生成的詞語集合,統計該詞語集合中的每個詞語及其詞頻;
S3.2:同義詞合并:針對S3.1中的詞語集合中的詞語及其詞頻進行同義詞合并,并對合并的同義詞的詞頻進行相加;
S3.3:關鍵詞選取:在S3.2中的經過同義詞合并后的詞語集合中選取詞頻排名前M的詞語作為關鍵詞,其中M為正整數且M小于或者等于該關鍵詞的數量;
S3.4:關鍵詞詞云可視化:針對S3.3選出的關鍵詞進行詞云可視化;
步驟四:在對關鍵詞進行詞云可視化后,形成關鍵詞共現矩陣并將該關鍵詞共現矩陣可視化,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海化學工業區公共管廊有限公司,未經上海化學工業區公共管廊有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910323713.4/2.html,轉載請聲明來源鉆瓜專利網。





