[發明專利]一種電力設備名稱識別方法在審
| 申請號: | 201811535713.2 | 申請日: | 2018-12-14 |
| 公開(公告)號: | CN109800416A | 公開(公告)日: | 2019-05-24 |
| 發明(設計)人: | 宮秀軍;周虎 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/903;G06Q50/06 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 劉子文 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符串數組 標準設備 分詞 詞匯 電力設備 名稱識別 識別設備 直接添加 專業詞庫 特征詞 串列 篩選 二叉搜索樹 名稱數據庫 數字搜索樹 相似度計算 存儲詞匯 符合條件 數據條目 閾值判斷 搜索樹 相似度 字符串 構建 電網 | ||
本發明公開了一種電力設備名稱識別方法,包括以下步驟:(1)構建電網專業詞庫用于存儲詞匯;包括直接添加單個詞匯、直接添加兩個以上詞匯、篩選添加詞匯;(2)實現分詞,將專業詞庫生成為三叉搜索樹,利用數字搜索樹和二叉搜索樹結合實現快速分詞;得到字符串數組或字符串列表;(3)將待識別設備名稱和標準設備名稱按照步驟(2)分成字符串數組或字符串列表,并提取其中可能符合所屬地、電壓等級的特征詞;(4)根據特征詞篩選標準設備名稱數據庫;將待識別設備名稱和標準設備名稱分詞后得到的兩個字符串數組進行相似度計算,得到一個0?1之間的相似度值,通過設定閾值判斷符合條件的字符串,選取相應的數據條目;實現設備相識度識別。
技術領域
本發明涉及電力設備名稱識別領域,具體是涉及一種電力設備名稱識別方法,能準確識別電力設備名稱并提升電力設備命名匹配的準確率。
背景技術
由于缺乏對電網設備命名標準的統一規范管理,目前調度系統應用常常是各應用自身擁有和維護一套甚至多套臺賬信息,這導致了涉及的設備臺賬信息和D5000,各網省OMS設備臺賬中的命名出現了大量不一致的情況,從而降低了應用的兼容性和拓展性。而在已開發設備匹配工具原型,利用LD相似度算法和jarccard相似度算法匹配配置數據庫中制定列中數據的相似度,對大于設定閾值的條目輸出對照表,解決大多常見命名不匹配情況,但其準確率不高,難以滿足用戶需求,所以需要提出準確率更高的匹配算法(匹配項:檢修票中檢修設備和線路、開關、母線表中的D5000命名和調度命名的匹配,要求對線路、開關、母線表中其他維度項可做關聯匹配,如開關表中的電壓等級、開關編號列)。
發明內容
本發明的目的是為了克服現有技術中的不足,提供一種電力設備名稱識別方法,該方法提高了匹配的準確率和效率,節省了時間。
本發明的目的是通過以下技術方案實現的:
一種電力設備名稱識別方法,包括以下步驟:
(1)構建電網專業詞庫用于存儲詞匯;包括直接添加單個詞匯、直接添加兩個以上詞匯、篩選添加詞匯;
(2)實現分詞,將專業詞庫生成為三叉搜索樹,利用數字搜索樹和二叉搜索樹結合實現快速分詞;得到字符串數組或字符串列表;
(3)將待識別設備名稱和標準設備名稱按照步驟(2)分成字符串數組或字符串列表,并提取其中可能符合所屬地、電壓等級的特征詞;
(4)根據特征詞篩選標準設備名稱數據庫;過濾數據以縮短計算時間;將待識別設備名稱和標準設備名稱分詞后得到的兩個字符串數組進行相似度計算,得到一個0-1之間的相似度值,通過設定閾值判斷符合條件的字符串,選取相應的數據條目;實現設備相識度識別。
進一步的,步驟(1)中直接添加單個詞匯是用于專有詞匯的添加;直接添加兩個以上詞匯是將電力設備中的某一關鍵屬性欄直接添加進詞庫當中;篩選添加詞匯用于直接將設備的名稱進行現有的詞庫分詞后,將目前不存在于詞庫中的詞匯添加進詞庫當中。
進一步的,分詞操作是使用最長字符串匹配法,將所給的字符串根據詞庫中記載的詞匯或同義詞完全分割開來,并選擇去除其中的無匹配字符子串或將無匹配字符子串保留在詞庫中;分詞后將會得到一組字符串數組或者字符串列表用于之后的相似度計算。
與現有技術相比,本發明的技術方案所帶來的有益效果是:本發明通過查詢詞庫的方式來實現電力設備名稱的語義識別,從給出的電力設備的規范以及不規范的名稱中查找出最為相似的多個電力設備,之后進行人工篩選或自動選取,提高匹配的準確率。
附圖說明
圖1是本發明方法的流程示意圖。
圖2是標準設備名稱數據庫的E-R圖。
圖3是具體實施例中識別過程的示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811535713.2/2.html,轉載請聲明來源鉆瓜專利網。





