[發明專利]列式數據庫及檢索事件序列的方法在審
| 申請號: | 202210437897.9 | 申請日: | 2022-04-25 |
| 公開(公告)號: | CN114756553A | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 葉楊;陳偉 | 申請(專利權)人: | 上海卓辰信息科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/242;G06F16/2458 |
| 代理公司: | 蘇州攜智匯佳專利代理事務所(普通合伙) 32278 | 代理人: | 錢偉 |
| 地址: | 200135 上海市浦東新區中國(上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據庫 檢索 事件 序列 方法 | ||
本發明提供了一種列式數據庫及檢索事件序列的方法,用于存儲和檢索事件序列。列式數據庫對數據進行如下處理:步驟a:將數據輸入列式數據庫;步驟b:對數據的時間字段設置索引;步驟c:判斷事件字段的數據類型,若為文本,且存在字符數大于8個的數據,進入步驟d,否則進入步驟g;步驟d:對事件字段去重;步驟e:根據去重結果,進行哈希編碼,構造事件數據序號字典;步驟f:遍歷列式數據庫,對所有事件字段中數據類型為文本的數據賦予對應的哈希編碼值,生成事件索引列;步驟g:根據索引將列式數據庫按時間升序進行排序。本發明解決了現有列式數據庫不便于對輸入的數據進行排序和檢索,且在事件字段的數據類型為文本時檢索復雜的問題。
技術領域
本發明涉及一種列式數據庫及檢索事件序列的方法,屬于數據存儲領域。
背景技術
在數據庫中,存儲了大量的數據,包括某一時間、某一主體及其發生的某一事件。在數據量較小時,可以對數據庫內的事件進行評估,提前發現問題或趨勢。而在數據量越來越大的今天,無法通過對單一事件的檢索,直觀的看出發生的情況及發展趨勢,也就無法評估對主體的影響。
事件序列是指連續的依次發生的多個事件的序列,事件序列可以準確的評估發生的情況及發展趨勢,但現有的列式數據庫僅能進行單一事件的檢索,無法對事件序列進行檢索,更無法對事件序列進行模糊檢索。同時現有的檢索方法在事件的數據類型為文本時僅能直接對文本內容進行檢索,檢索復雜不便。
有鑒于此,確有必要提供一種列式數據庫及檢索事件序列的方法,以解決上述問題。
發明內容
本發明的目的在于提供一種列式數據庫及檢索事件序列的方法,解決了現有列式數據庫不便于對輸入的數據進行排序和檢索,且在事件字段的數據類型為文本時檢索復雜、效率較低的問題。
為實現上述目的,本發明提供了一種列式數據庫,用于存儲和檢索事件序列,所述列式數據庫能夠對數據進行如下處理:
步驟a:將數據輸入列式數據庫,所述數據為時序數據,至少包括時間字段和事件字段;
步驟b:對步驟a中輸入的數據的時間字段設置索引;
步驟c:判斷所述數據中的事件字段的數據類型,若所述事件字段的數據類型為文本,且存在字符數大于8個的數據,則進入步驟d,否則進入步驟g;
步驟d:對所述事件字段的內容進行去重;
步驟e:根據步驟d的去重結果,進行哈希編碼,構造事件數據序號字典;
步驟f:遍歷列式數據庫,對所有事件字段中數據類型為文本的數據按所述事件數據序號字典賦予對應的哈希編碼值,在列式數據庫生成相應的事件索引列;
步驟g:根據步驟b中對時間字段設置的索引將所述列式數據庫按時間升序進行排序。
作為本發明的進一步改進,所述列式數據庫中的數據還包括除所述事件字段和所述時間字段之外的任意屬性字段。
本發明還提供了一種檢索事件序列的方法,應用于前述的列式數據庫中,具體包括以下步驟:
步驟1:輸入待檢索事件序列,并轉化為查詢語句;
步驟2:判斷待檢索事件序列的數據類型,當待檢索事件序列的數據類型為數值或單字符或字符數均小于等于8個的文本時,進入步驟4;當待檢索事件序列的數據類型為文本,且存在字符數大于8個的數據時,進入步驟3;
步驟3:將待檢索事件序列進行哈希編碼,待檢索事件序列的數據類型轉變為數值后進入步驟4;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海卓辰信息科技有限公司,未經上海卓辰信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210437897.9/2.html,轉載請聲明來源鉆瓜專利網。





