[發明專利]一種繼電保護裝置設備數據模型智能分析方法有效
| 申請號: | 201710541955.1 | 申請日: | 2017-07-05 |
| 公開(公告)號: | CN107357784B | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 陳中;邵雷;方國權 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F40/242 | 分類號: | G06F40/242;G06F40/289;G06F40/216;G06F16/31 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 保護裝置 設備 數據模型 智能 分析 方法 | ||
1.一種繼電保護裝置設備數據模型智能分析方法,其特征在于:包括分詞策略、繼電保護專用詞典機制和改進正向最大匹配算法;
所述分詞策略為中文分詞與非漢字字符同時處理的分詞策略,具體包括以下步驟:
(1.1)初始化待切分字符串和分詞結果字符串;
(1.2)判斷待分詞字符串是否為空;若不為空轉步驟1.3;若為空轉步驟1.8;
(1.3)取待分詞字符串首字符,判斷其字符類型;若為英文字符、數字、空格符、回車符和換行符,轉步驟1.4;若為非漢字 雙字節特殊字符,轉步驟1.5;若為中文漢字 字符,轉步驟1.6;
(1.4)統計并截取連續的英文字符、數字、空格符、回車符和換行符,共計i個,作為分詞結果字符串的自增量,轉步驟1.7;
(1.5)統計并截取連續的非漢字雙字節特殊字符,共計i個,作為分詞結果字符串的自增量,轉步驟1.7;
(1.6)統計并截取連續的中文漢字字符,共計i個,作為分詞結果字符串的自增量,轉步驟1.7;
(1.7)更新待切分字符串,將待分詞字符串第i位至最后一位作為新值賦給待分詞字符串,轉步驟1.2;
(1.8)返回輸出分詞結果字符串;
所述繼電保護專用詞典機制為帶最大詞長的繼電保護專用詞典機制,所述帶最大詞長的繼電保護專用詞典機制在結構上分為三層,包括首字哈希表、詞索引表和詞典正文;
所述首字哈希表包括首字、最大詞長、第一項指針和最末項指針;其中,首字為繼電保護專用詞典中記錄的關鍵詞的第一個字;最大詞長用于存儲對應首字所有詞長中的最大值;第一項指針用于指向首字在索引表中的起始位置;最末項指針用于指向首字在索引表中的最末位置;
所述詞索引表包括所有詞長和詞典正文指針;其中,所有詞長為首字對應關鍵詞的所有詞長;詞典正文指針指向該詞長在詞典正文中的第一個詞的位置;
所述詞典正文用于記錄繼電保護專業的所有關鍵詞;
所述改進正向最大匹配算法為動態獲取最大詞長的改進正向最大匹配算法,所述動態獲取最大詞長的改進正向最大匹配算法具體包括以下步驟:
(2.1)初始化待切分字符串和輸出詞串;
(2.2)判斷待切分字符串是否為空;若是為空轉步驟2.11;若不為空轉步驟2.3;
(2.3)取待切分字符串首字,并獲取首字在哈希表中的位置;
(2.4)獲取存儲在該位置的最大詞長;
(2.5)從待切分字符串左邊開始,取出候選字符串,候選字符串的長度不大于最大詞長;
(2.6)查找詞典,判斷候選字符串是否在詞典中;若是,轉步驟2.9;否則轉步驟2.7;
(2.7)更新候選字符串,將候選字符串最右邊一個字符去掉;
(2.8)判斷候選字符串是否為單字;若是,轉步驟2.9;否則轉步驟2.6;
(2.9)更新輸出詞串,將候選字符串添加到輸出詞串;
(2.10)更新待切分字符串,將待切分字符串去除候選字符串的剩余部分賦給待切分字符串,轉步驟2.2;
(2.11)返回輸出詞串。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710541955.1/1.html,轉載請聲明來源鉆瓜專利網。





