[發明專利]一種基于Ternary Search Trie的電力設備模型特征匹配方法在審
| 申請號: | 201911115893.3 | 申請日: | 2019-11-14 |
| 公開(公告)號: | CN110866397A | 公開(公告)日: | 2020-03-06 |
| 發明(設計)人: | 張鵬;肖林朋;張浩;王守琴;郭子明;穆永錚;戚岳;孫舶皓;劉蒙;耿艷;張旭 | 申請(專利權)人: | 國網冀北電力有限公司;國家電網有限公司;北京科東電力控制系統有限責任公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/295;G06F40/30;G06F16/31;G06F16/33;G06K9/62 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 100045 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ternary search trie 電力設備 模型 特征 匹配 方法 | ||
本發明公開一種基于Ternary Search Trie的電力設備模型特征匹配方法,包括以下步驟:步驟a,使用遞歸的方法將專業電力設備名稱存放在三叉字典查找樹中,建立起電力專業詞庫;步驟b,將電力專業詞庫中電力語術進行分詞操作,統一數字書寫;步驟c,基于分詞的效果,計算電力設備模型特征語義相似度。本發明提供的一種基于Ternary Search Trie的電力設備模型特征匹配方法,選用三叉查詢字典樹,具備存儲高效,查詢快速優點;對設備名稱進行數字書寫統一,具有電力設備命名實體識別功能;考慮詞序以及阿拉伯數字和特殊字符之間的相似性,適用于針對非常規設備編號的相似度計算問題。
技術領域
本發明涉及一種基于Ternary Search Trie的電力設備模型特征匹配方法,屬于電力系統調度自動化技術領域。
背景技術
隨著智能電網科技的快速發展以及信息化的大數據時代到來,針對電網專業的名稱識別,使用基于數據和算法的識別服務將逐步代替人工識別工作。這種使用原始數據,針對電網行業的算法是保障數據應用質量,是電網數據發揮價值的關鍵一步。由于缺乏對電網設備命名標準的統一規范管理,調度系統應用更是各應用自身擁有和維護一套甚至多套臺賬信息,這些問題都導致了涉及的設備臺賬信息命名出現了大量不一致的情況,降低了應用的兼容性和拓展性,由此,解析設備名稱中的語義信息,并識別出本質為同一設備的不同命名成為提升電力、互聯網交互行業的工作效率的主要難點。
在現有工作中對于設備名稱相似度匹配已經投入一些研究,主要是基于文本比較的編輯距離計算,利用LD相似度算法和jarccard相似度算法匹配配置數據庫制定列中數據的相似度,對大于設定閾值的條目輸出對照表,識別常見命名不匹配情況。單純的比較編輯距離算法,由于是將設備名稱作為兩個給定的文本,造成依賴字符串的分詞順序,對于記錄缺失或者不規范的設備名缺乏識別能力,對于專業電網業務場景面臨的專業詞庫和單純的中文或英文命名沒有很好的解決。
發明內容
本發明要解決的技術問題是,克服現有技術的缺陷,提供一種具備存儲高效,查詢快速優點,具有電力設備命名實體識別功能,適用于針對非常規設備編號的相似度計算問題的基于Ternary Search Trie的電力設備模型特征匹配方法。
為解決上述技術問題,本發明采用的技術方案為:
一種基于Ternary Search Trie的電力設備模型特征匹配方法,包括以下步驟:
步驟a,使用遞歸的方法將專業電力設備名稱存放在三叉字典查找樹中,建立起電力專業詞庫;
步驟b,將電力專業詞庫中電力語術進行分詞操作,統一數字書寫;
步驟c,基于分詞的效果,計算電力設備模型特征語義相似度。
步驟a包括以下具體步驟:
步驟a1,將數據庫中的詞匯進行清洗和去重后按照Unicode編碼順序排序存在數組中;
步驟a2,如果數組長度大于一則輸出數據組中點的值寫入新數組;
步驟a3,將輸入的詞匯拆分為單個字符,分別對左子樹和右子樹進行單字符的插入;
步驟a4,如果數組長度大于1,那么左邊數組遞歸調用函數,如果數組長度大于1,那么右邊數組遞歸調用函數;
步驟a5,返回插入數據后的樹結構。
步驟b包括以下具體步驟:
步驟b1,計算輸入字符串的字符長度;
步驟b2,記錄匹配起始位置;
步驟b3,進入循環并記錄起始位置小于字符串長度的值;
步驟b4,在循環中記錄正向最大長度單詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網冀北電力有限公司;國家電網有限公司;北京科東電力控制系統有限責任公司,未經國網冀北電力有限公司;國家電網有限公司;北京科東電力控制系統有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911115893.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:塑料產品生產系統
- 下一篇:碼緣鋸齒防偽方法及產品





