[發明專利]列式數據庫及檢索事件序列的方法在審
| 申請號: | 202210437897.9 | 申請日: | 2022-04-25 |
| 公開(公告)號: | CN114756553A | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 葉楊;陳偉 | 申請(專利權)人: | 上海卓辰信息科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/242;G06F16/2458 |
| 代理公司: | 蘇州攜智匯佳專利代理事務所(普通合伙) 32278 | 代理人: | 錢偉 |
| 地址: | 200135 上海市浦東新區中國(上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據庫 檢索 事件 序列 方法 | ||
1.一種列式數據庫,用于存儲和檢索事件序列,其特征在于,所述列式數據庫能夠對數據進行如下處理:
步驟a:將數據輸入列式數據庫,所述數據為時序數據,至少包括時間字段和事件字段;
步驟b:對步驟a中輸入的數據的時間字段設置索引;
步驟c:判斷所述數據中的事件字段的數據類型,若所述事件字段的數據類型為文本,且存在字符數大于8個的數據,則進入步驟d,否則進入步驟g;
步驟d:對所述事件字段的內容進行去重;
步驟e:根據步驟d的去重結果,進行哈希編碼,構造事件數據序號字典;
步驟f:遍歷列式數據庫,對所有事件字段中數據類型為文本的數據按所述事件數據序號字典賦予對應的哈希編碼值,在列式數據庫生成相應的事件索引列;
步驟g:根據步驟b中對時間字段設置的索引將所述列式數據庫按時間升序進行排序。
2.根據權利要求1所述的列式數據庫,其特征在于:所述列式數據庫中的數據還包括除所述事件字段和所述時間字段之外的任意屬性字段。
3.一種檢索事件序列的方法,應用于權利要求1~2中任一項所述的列式數據庫中,其特征在于,具體包括以下步驟:
步驟1:輸入待檢索事件序列,并轉化為查詢語句;
步驟2:判斷待檢索事件序列的數據類型,當待檢索事件序列的數據類型為數值或單字符或字符數均小于等于8個的文本時,進入步驟4;當待檢索事件序列的數據類型為文本,且存在字符數大于8個的數據時,進入步驟3;
步驟3:將待檢索事件序列進行哈希編碼,待檢索事件序列的數據類型轉變為數值后進入步驟4;
步驟4:選擇查詢類型,若是精確查詢,則以待檢索事件序列作為一個數組整體去精確匹配檢索;若是模糊查詢,則根據預設模糊查詢距離,進行模糊匹配檢索,此時將待檢索事件序列作為一個數組整體計算與事件序列中的數據組成序列的最小距離,最小距離小于等于預設模糊查詢距離;
步驟5:構建結果字典,將所有匹配到的對應序列加入結果字典,直到遍歷完事件字段的所有數據;
步驟6:輸出結果字典作為結果。
4.根據權利要求3所述的檢索事件序列的方法,其特征在于:所述待檢索事件序列為多個事件依次排列組成的序列。
5.根據權利要求3所述的檢索事件序列的方法,其特征在于:步驟1中的所述查詢語句為類SQL語句。
6.根據權利要求5所述的檢索事件序列的方法,其特征在于:所述查詢語句包括依次設置的第一參數、第二參數及第三參數,所述第一參數配置為篩選查詢的字段,所述第二參數配置為限定查詢的存儲地址,所述第三參數配置為限定檢索條件。
7.根據權利要求6所述的檢索事件序列的方法,其特征在于:所述第三參數包括所述待檢索事件序列。
8.根據權利要求3所述的檢索事件序列的方法,其特征在于:所述步驟4中進行模糊查詢計算最小距離具體為采用Levenshtein算法,計算數據類型為字符串時,把所述待檢索事件序列中的任一字符串通過添加、刪除、替換字符的方式轉變成所述事件字段中的任一字符串所需要的最少步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海卓辰信息科技有限公司,未經上海卓辰信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210437897.9/1.html,轉載請聲明來源鉆瓜專利網。





