[發明專利]一種多關鍵字的搜索方法、系統、介質及設備在審
| 申請號: | 201810048761.2 | 申請日: | 2018-01-18 |
| 公開(公告)號: | CN108133052A | 公開(公告)日: | 2018-06-08 |
| 發明(設計)人: | 王家慶;葉劍飛;黃昌金 | 申請(專利權)人: | 廣州匯智通信技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 510639 廣東省廣州市天*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 目標字符串 關鍵字搜索 狀態自動機 搜索結果 回退 預設 流式數據 預設規則 遍歷 讀入 構建 查找 失敗 重復 申請 應用 | ||
1.一種多關鍵字搜索方法,其特征在于,應用于流式數據,包括:
在預設有限狀態自動機的當前狀態下,讀入目標字符串的字符,以在讀入的目標字符串的字符中搜索與待搜索的多關鍵字對應的字符,以得到搜索結果;其中,所述預設有限狀態自動機為根據所述多關鍵字所構建的有限狀態自動機;
若搜索失敗,則利用預設規則重復查找當前狀態的回退狀態,直至利用所述回退狀態和目標字符串的字符,搜索得到與所述多關鍵字的字符對應的搜索結果。
2.根據權利要求1所述的方法,其特征在于,還包括:
在所述有限狀態自動機的當前狀態下,讀入所述多關鍵字的字符,輸出得到與當前狀態對應的當前遷移狀態和輸出字符,并記錄當前狀態和當前遷移狀態的對應關系,得到轉向函數表;
在所述有限狀態自動機的當前遷移狀態下,讀入輸出字符,并進行搜索;
若搜索失敗,則輸出與當前遷移狀態對應的回退狀態,并記錄當前遷移狀態與回退狀態的對應關系,得到失效函數表;
若搜索成功,則輸出與當前遷移狀態對應的匹配關鍵字,并記錄當前遷移狀態與匹配關鍵字的對應關系,得到輸出函數表;
將所述轉向函數表、所述失效函數表和所述輸出函數表進行匯總,得到所述預設有限狀態自動機。
3.根據權利要求2所述的方法,其特征在于,還包括:
在所述有限狀態自動機的任意狀態下,將讀入所述多關鍵字的字符所對應的搜索結果插入至所述轉向函數表中;其中,所述搜索結果包括與讀入所述關鍵字的字符對應輸出的匹配關鍵字和/或回退狀態的對應關系。
4.根據權利要求2所述的方法,其特征在于,所述若搜索失敗,則利用預設規則重復查找當前狀態的回退狀態的過程,包括:
若搜索失敗,則利用所述失效函數表重復查找當前狀態的回退狀態。
5.根據權利要求1至4任一項所述的方法,其特征在于,還包括:
利用內存池管理技術對所述流式數據進行處理,以減少系統資源的消耗。
6.一種多關鍵字搜索系統,其特征在于,應用于流式數據,包括:
字符讀入模塊,用于在預設有限狀態自動機的當前狀態下,讀入目標字符串的字符,以在讀入的目標字符串的字符中搜索與待搜索的多關鍵字對應的字符,以得到搜索結果;其中,所述預設有限狀態自動機為根據所述多關鍵字所構建的有限狀態自動機;
字符搜索模塊,用于若搜索失敗,則利用預設規則重復查找當前狀態的回退狀態,直至利用所述回退狀態和目標字符串的字符,搜索得到與所述多關鍵字的字符對應的搜索結果。
7.根據權利要求6所述的系統,其特征在于,還包括:
第一函數表建立模塊,用于在所述有限狀態自動機的當前狀態下,讀入所述多關鍵字的字符,輸出得到與當前狀態對應的當前遷移狀態和輸出字符,并記錄當前狀態和當前遷移狀態的對應關系,得到轉向函數表;
輸出字符讀入模塊,用于在所述有限狀態自動機的當前遷移狀態下,讀入輸出字符,并進行搜索;
第二函數表建立模塊,用于若搜索失敗,則輸出與當前遷移狀態對應的回退狀態,并記錄當前遷移狀態與回退狀態的對應關系,得到失效函數表;
第三函數表建立模塊,用于若搜索成功,則輸出與當前遷移狀態對應的匹配關鍵字,并記錄當前遷移狀態與匹配關鍵字的對應關系,得到輸出函數表;
自動機創建模塊,用于將所述轉向函數表、所述失效函數表和所述輸出函數表進行匯總,得到所述預設有限狀態自動機。
8.根據權利要求6或7所述的系統,其特征在于,還包括:
數據處理模塊,用于利用內存池管理技術對所述流式數據進行處理,以減少系統資源的消耗。
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至5任一項所述的多關鍵字搜索方法的步驟。
10.一種多關鍵字搜索設備,其特征在于,包括:
存儲器,用于存儲計算機程序;
處理器,用于執行所述計算機程序時實現如權利要求1至5任一項所述多關鍵字搜索方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州匯智通信技術有限公司,未經廣州匯智通信技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810048761.2/1.html,轉載請聲明來源鉆瓜專利網。





