[發(fā)明專利]一種基于編輯距離算法的特種設(shè)備故障分析方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201711098298.4 | 申請(qǐng)日: | 2017-11-09 |
| 公開(公告)號(hào): | CN107784115B | 公開(公告)日: | 2019-01-22 |
| 發(fā)明(設(shè)計(jì))人: | 潘健鴻;張偉;張莉君;李智翔;黃春榕 | 申請(qǐng)(專利權(quán))人: | 福建省特種設(shè)備檢驗(yàn)研究院 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/28;G06F17/27 |
| 代理公司: | 福州旭辰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35233 | 代理人: | 程春寶 |
| 地址: | 350008 福*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 編輯 距離 算法 特種設(shè)備 故障 分析 方法 系統(tǒng) | ||
本發(fā)明提供了一種基于編輯距離算法的特種設(shè)備故障分析方法,所述方法為:步驟S1、通過讀取特種設(shè)備的檢驗(yàn)項(xiàng)目數(shù)據(jù)中xml文件,獲得xml文件中的特種設(shè)備不合格描述;步驟S2、通過編輯距離算法edit_distance對(duì)不合格描述中的相似描述進(jìn)行聚類歸集,獲得各個(gè)不合格描述中相似度的值,步驟S3、根據(jù)聚類歸集結(jié)果提取出相似度值大于70的為近似數(shù)據(jù),并將近似數(shù)據(jù)進(jìn)行分組;步驟S4、建立一分詞庫(kù),將分組后的近似數(shù)據(jù)與所述分詞庫(kù)中的分詞進(jìn)行匹配篩選,然后將分組后的近似數(shù)據(jù)以圖形的方式進(jìn)行展示,從而實(shí)現(xiàn)特種設(shè)備故障分析。本發(fā)明能直觀地得知特種設(shè)備故障情況。
技術(shù)領(lǐng)域
本發(fā)明涉及特種設(shè)備檢測(cè)技術(shù)領(lǐng)域,特別是一種基于編輯距離算法的特種設(shè)備故障分析方法及系統(tǒng)。
背景技術(shù)
現(xiàn)有的特種設(shè)備的檢驗(yàn)報(bào)告,一般是通過工作人員在現(xiàn)場(chǎng)對(duì)特種設(shè)備進(jìn)行檢驗(yàn),對(duì)檢驗(yàn)的數(shù)據(jù)進(jìn)行采集。其中,特種設(shè)備檢驗(yàn)原始記錄中包含有檢驗(yàn)項(xiàng)目數(shù)據(jù),該檢驗(yàn)項(xiàng)目數(shù)據(jù)中存在一“不合格描述”的字段,該不合格描述的字段均為檢驗(yàn)員自己手工填入,且填入的數(shù)據(jù)沒有規(guī)則性;即不同的檢驗(yàn)員填入的描述會(huì)不同,但是該描述中一些關(guān)鍵字都會(huì)存在。由于檢驗(yàn)員填入的數(shù)據(jù)沒有規(guī)則性,這樣要想知道特種設(shè)備故障的情況,要從檢驗(yàn)報(bào)告中去檢查每個(gè)記錄的“不合格描述”的字段的內(nèi)容,這樣不僅不直觀,而且故障分析效率低。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題之一,本發(fā)明的目的是提供一種基于編輯距離算法的特種設(shè)備故障分析方法;能對(duì)特種設(shè)備檢驗(yàn)原始記錄的檢驗(yàn)項(xiàng)目數(shù)據(jù)的無(wú)規(guī)則不合格描述進(jìn)行質(zhì)量分析,從而能直觀地得知特種設(shè)備故障情況。
本發(fā)明的技術(shù)問題之一采用以下方案實(shí)現(xiàn):一種基于編輯距離算法的特種設(shè)備故障分析方法,所述方法具體為:
步驟S1、通過讀取特種設(shè)備的檢驗(yàn)項(xiàng)目數(shù)據(jù)中xml文件,獲得xml文件中的特種設(shè)備不合格描述,所述不合格描述為特種設(shè)備的項(xiàng)目不合格的記錄;
步驟S2、通過編輯距離算法edit_distance對(duì)不合格描述中的相似描述進(jìn)行聚類歸集,獲得各個(gè)不合格描述中相似度的值,所述相似度的值為0~100,100為完全相似,0為完全不相似;
步驟S3、根據(jù)聚類歸集結(jié)果提取出相似度值大于70的為近似數(shù)據(jù),并將近似數(shù)據(jù)進(jìn)行分組,
步驟S4、建立一分詞庫(kù),將分組后的近似數(shù)據(jù)與所述分詞庫(kù)中的分詞進(jìn)行匹配篩選,然后將分組后的近似數(shù)據(jù)以圖形的方式進(jìn)行展示,從而實(shí)現(xiàn)特種設(shè)備故障分析。
進(jìn)一步的,所述分詞庫(kù)中包括有多個(gè)的分詞,所述分詞包括未提供年度自行檢查記錄分詞、現(xiàn)場(chǎng)未提供電梯安全管理人員證分詞、無(wú)有資質(zhì)的維保單位配合分詞、未見使用登記證分詞、未提供有效的電梯維修保養(yǎng)合同分詞、以及未提供限速器校驗(yàn)報(bào)告分詞。
進(jìn)一步的,所述步驟S1之前還包括:步驟S10:抽取特種設(shè)備檢驗(yàn)原始記錄的檢驗(yàn)項(xiàng)目數(shù)據(jù),該檢驗(yàn)項(xiàng)目數(shù)據(jù)填入在excel表格中,其中檢驗(yàn)項(xiàng)目數(shù)據(jù)中的“不合格描述”的字段均為檢驗(yàn)員自己手工填入,且填入的數(shù)據(jù)沒有規(guī)則性;然后將excel表格中的檢驗(yàn)項(xiàng)目數(shù)據(jù)抽取到一特種設(shè)備檢驗(yàn)平臺(tái)中形成一xml文件。
進(jìn)一步的,所述步驟S2進(jìn)一步具體為:通過編輯距離算法edit_distance對(duì)不合格描述中的相似描述進(jìn)行聚類歸集,將不合格描述進(jìn)行聚類歸集到一字段表中,并獲得各個(gè)不合格描述中相似度的值。
本發(fā)明要解決的技術(shù)問題之二,本發(fā)明的目的是提供一種基于編輯距離算法的特種設(shè)備故障分析系統(tǒng),能對(duì)特種設(shè)備檢驗(yàn)原始記錄的檢驗(yàn)項(xiàng)目數(shù)據(jù)的無(wú)規(guī)則不合格描述進(jìn)行質(zhì)量分析,從而能直觀地得知特種設(shè)備故障情況。
本發(fā)明的技術(shù)問題之二采用以下方案實(shí)現(xiàn):一種基于編輯距離算法的特種設(shè)備故障分析系統(tǒng),所述系統(tǒng)包括獲取模塊、編輯距離算法模塊、分組模塊以及圖形展示模塊;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建省特種設(shè)備檢驗(yàn)研究院,未經(jīng)福建省特種設(shè)備檢驗(yàn)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711098298.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 距離測(cè)定裝置、距離測(cè)定方法以及距離測(cè)定程序
- 光波距離測(cè)定方法、距離測(cè)定程序以及距離測(cè)定系統(tǒng)
- 光波距離測(cè)定方法、距離測(cè)定程序以及距離測(cè)定裝置
- 瞳孔距離、視線距離測(cè)量裝置
- 距離測(cè)定系統(tǒng)、距離測(cè)定方法
- 距離測(cè)定方法及距離測(cè)定系統(tǒng)
- 距離檢測(cè)裝置及其距離檢測(cè)方法
- 距離測(cè)量裝置、距離測(cè)量方法和距離測(cè)量系統(tǒng)
- 距離測(cè)量處理裝置、距離測(cè)量模塊和距離測(cè)量處理方法
- 距離測(cè)量裝置、距離測(cè)量系統(tǒng)、距離測(cè)量方法和程序





