[發(fā)明專利]一種基于確定有窮狀態(tài)機的同義詞快速替換方法有效
| 申請?zhí)枺?/td> | 201811230063.0 | 申請日: | 2018-10-22 |
| 公開(公告)號: | CN109492218B | 公開(公告)日: | 2023-03-21 |
| 發(fā)明(設計)人: | 曾光;郭運艷;李明明;潘心冰 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06F40/247 | 分類號: | G06F40/247;G06F40/289;G06F9/448 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 王守梅 |
| 地址: | 271000 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 確定 有窮 狀態(tài)機 同義詞 快速 替換 方法 | ||
1.一種基于確定有窮狀態(tài)機的同義詞快速替換方法,其特征在于,首先將同義詞字符列表通過有窮狀態(tài)機DFA構建同義詞哈希表;然后利用同義詞哈希表查找并快速定位待替換詞,最后將待替換詞一起替換;
所述的查找流程包括遍歷語料中的每一個字符,以字符為鍵值在DFA哈希表中查找同義詞,若只匹配到一個字符,則在同義詞哈希表中找到相應的子樹繼續(xù)匹配查詢,直到完整的字符被完全匹配出來,匹配后則記錄待替換詞,最后將語料中的待替換詞一起全部替換;
若語料中只包含DFA哈希表中的一個字符,但不包含完整的同義詞,則該詞不會被匹配出來;
所述的DFA哈希表的構造流程包括:
是否遍歷待替換詞列表,若是,結束;若否,則進入下一步;
是否遍歷待替換詞所有字符;若是,則構建葉子節(jié)點;若否,則進入下一步;
根據字符獲取子表;判斷子表是否存在,若不存在,則構建新的子節(jié)點,若存在,則DFA哈希表為當前子表;
所述的DFA哈希表適用于中文字符串或英文字符串。
2.一種基于確定有窮狀態(tài)機的同義詞快速替換系統(tǒng),其特征在于,包括哈希表構造模塊、同義詞查找模塊和同義詞替換模塊;
所述的哈希表構造模塊,用于將同義詞字符列表通過有窮狀態(tài)機DFA構建同義詞哈希表;
所述的同義詞查找模塊,用于查找并快速定位待替換詞;
所述的同義詞替換模塊,用于替換待替換詞;
所述的哈希表構造模塊,用于在查找過程中,如果當前狀態(tài)沒有與所述待匹配信息的字符相匹配的下一狀態(tài),跳轉到所述當前狀態(tài)的失敗狀態(tài)繼續(xù)匹配;
所述的哈希表構造模塊,遍歷單元、獲取單元以及構建單元;
遍歷單元,用于遍歷待替換詞列表以及待替換詞的所有字符;
獲取單元,用于根據字符獲取子表;
構建單元,用于構建葉子節(jié)點。
3.一種基于確定有窮狀態(tài)機的同義詞快速替換系統(tǒng)的服務器,其特征在于,所述服務器包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執(zhí)行時,使得所述一個或多個處理器實現如權利要求1中所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811230063.0/1.html,轉載請聲明來源鉆瓜專利網。





