[發明專利]使用優化的位圖表示來管理大規模關聯集有效
| 申請號: | 201880006890.3 | 申請日: | 2018-02-20 |
| 公開(公告)號: | CN110178128B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | R·拉斐爾;R·德塞;G·瓦倫西亞;J·L·佩雷茲;M·加亞潘迪安;I·V·梁 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅;李崢宇 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 優化 位圖 表示 管理 大規模 聯集 | ||
1.一種處理數據集的數據庫查詢的方法,包括:
將整數空間中的唯一標識符分配給數據內的每個實體,并創建一個或多個實體集,每個實體屬于數據內的對應實體;
將由實體標識符表示的實體集劃分成多個區段,其中每個區段的內容和每個區段的元數據存儲在單獨的數據對象中,其中每個區段是用于指示關聯的插入類型和指示解離的刪除類型之一,并且區段大小基于請求大小、壓縮類型和運行時優化,并且其中多個區段按時間順序排序并用于通過合并、插入和刪除區段來生成實體集的內容;
在磁盤上為每個實體集生成表示,其中每個表示包含并適合于對應集內的實體的唯一標識符的范圍,并指示該對應集內的實體的存在;和
基于每個實體集的表示處理查詢以檢索滿足查詢的數據,其中該表示為關聯和解離操作提供恒定時間,該操作是僅附加操作,在查詢時具有延遲合并以及自動過濾已刪除和重復的實體,并且同時對多個區段執行操作。
2.如權利要求1所述的方法,其中至少一個實體集包括與特定實體關聯的實體。
3.如權利要求1所述的方法,其中至少一個實體集包括與特定實體分離的實體。
4.如權利要求1所述的方法,其中,實體表示來自人、文檔、事件和對象的組中的一個或多個實例。
5.如權利要求1所述的方法,其中實體集區段的實體標識符的元數據與該區段一起作為有效載荷存儲。
6.如權利要求1所述的方法,其中處理查詢還包括:
評估對多個區段的查詢并組合來自每個評估區段的結果。
7.如權利要求1所述的方法,其中實體集包括具有重復實體標識符的包含非唯一實體的多集,其中重復實體標識符保留在該實體集的物理表示中,并且查詢請求該實體集或多集表示。
8.一種用于處理數據集的數據庫查詢的系統,包括:
處理器配置為:
將整數空間中的唯一標識符分配給數據內的每個實體,并創建一個或多個實體集,每個實體屬于數據內的對應實體;
將由實體標識符表示的實體集劃分成多個區段,其中每個區段的內容和每個區段的元數據存儲在單獨的數據對象中,其中每個區段是用于指示關聯的插入類型和指示解離的刪除類型之一,并且區段大小基于請求大小、壓縮類型和運行時優化,并且其中多個區段按時間順序排序并用于通過合并、插入和刪除區段來生成實體集的內容;
在磁盤上為每個實體集生成表示,其中每個表示包含并適合于對應集內的實體的唯一標識符的范圍,并指示該對應集內的實體的存在;和
基于每個實體集的表示處理查詢以檢索滿足查詢的數據,其中該表示為關聯和解離操作提供恒定時間,該操作是僅附加操作,在查詢時具有延遲合并以及自動過濾已刪除和重復的實體,并且同時對多個區段執行操作。
9.如權利要求8所述的系統,其中至少一個實體集包括與特定實體關聯的實體。
10.如權利要求8所述的系統,其中至少一個實體集包括與特定實體分離的實體。
11.如權利要求8所述的系統,其中,實體表示來自人、文檔、事件和對象的組中的一個或多個實例。
12.如權利要求8所述的系統,其中實體集區段的實體標識符的元數據與該區段一起作為有效載荷存儲。
13.如權利要求8所述的系統,其中處理查詢還包括:
評估對多個區段的查詢并組合來自每個評估區段的結果。
14.如權利要求8所述的系統,其中實體集包括具有重復實體標識符的包含非唯一實體的多集,其中重復實體標識符保留在該實體集的物理表示中,并且查詢請求該實體集或多集表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880006890.3/1.html,轉載請聲明來源鉆瓜專利網。





