[發明專利]增量式地更新統計有效
| 申請號: | 201380076186.2 | 申請日: | 2013-04-30 |
| 公開(公告)號: | CN105164675A | 公開(公告)日: | 2015-12-16 |
| 發明(設計)人: | C·拉克什米納拉亞;R·科舒魯;陳啟凡;H·澤勒 | 申請(專利權)人: | 惠普發展公司;有限責任合伙企業 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/18 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 康泉;宋志強 |
| 地址: | 美國德*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 增量 更新 統計 | ||
背景技術
在某些類型的數據庫中,比如關系型數據庫中,查詢計劃優化器使用關于數據庫的數據進行統計。響應于接收查詢,生成關于如何搜索數據庫的多個查詢計劃。查詢計劃優化器作出關于這些查詢計劃中的哪些將在最短時間內根據搜索查詢中的術語引起搜索數據庫的決定。依賴于數據庫,統計允許搜索查詢優化器在無需從頭計算關于數據庫的數據的信息的情況下,選擇查詢計劃。
附圖說明
附圖圖示本文描述的原理的各種示例并且是說明書的一部分。圖示的示例僅僅是示例并且不限制權利要求的范圍。
圖1是根據本文描述的原理的網絡上的數據庫的示例的示意圖。
圖2是根據本文描述的原理的數據庫列的樣本的示例的示意圖。
圖3是根據本文描述的原理的唯一條目計數估計器的示例的示意圖。
圖4A是根據本文描述的原理的布隆(bloom)過濾器的示例的示意圖。
圖4B是根據本文描述的原理的直方圖的示例的示意圖。
圖5是根據本文描述的原理從數據庫列的樣本刪除行的示例的示意圖。
圖6是根據本文描述的原理添加插入到的數據庫列的樣本的示例的示意圖。
圖7是根據本文描述的原理的布隆過濾器的示例的示意圖。
圖8是根據本文描述的原理的直方圖的示例的示意圖。
圖9是根據本文描述的原理用于增量式地更新數據庫統計的方法的示例的示意圖。
圖10是根據本文描述的原理的更新系統的示例的示意圖。
圖11是根據本文描述的原理的更新系統的示例的示意圖。
圖12是根據本文描述的原理的增量式地更新數據庫統計的過程的流程圖的示例的示意圖。
具體實施方式
為了提供查詢優化器有益的統計信息,統計被更新。然而,更新統計導致數據庫能力和處理資源耗盡。在某些情況下,因為資源被提供給更新統計,因此這種更新阻礙了其他操作的性能。
本文描述的原理包括在數據庫的數據分布已被確定在統計上保持不變時,用于利用較少工作且基于樣本估計統計更新統計的機制。該機制確定數據庫中的什么數據已經改變的足夠以值得更新統計,而不是僅基于樣本估計統計。這些原理包括用于增量式更新數據庫的方法。這種方法包括對數據庫中的數據庫列的行進行采樣以生成第一樣本,隨后在生成第一樣本之后,對數據庫列的修改的行的子集進行采樣以生成第二樣本,基于第一樣本和第二樣本確定數據庫列是否發生分布變化,并且響應于確定存在分布變化而更新關于數據庫列的數據庫統計。修改的行可包括刪除的行、插入的行、更新的行或其組合。
在下面的描述中,出于解釋的目的,為了提供本系統和方法的全面理解,提出了許多具體細節。然而,對本領域技術人員來說顯而易見的是,可在沒有這些具體細節的情況下實踐本裝置、提供和方法。說明書中提及的“示例”或類似語言意味著描述的特定的特征、結構或特性被包括在至少一個示例中,但不必在其他示例中。
圖1是根據本文描述的原理的網絡上的數據庫(100)的示例的示意圖。在此示例中,客戶設備(104)與網絡(102)通信,網絡(102)通信與數據庫(100)通信。
客戶設備(104)可以是用戶使用來與數據庫(100)通信的任何適當的設備。客戶設備(104)筆記本電腦、個人計算機、臺式機、電話、電子輸入板、電子設備、任何類型的客戶端設備或其組合。
用戶可以在客戶設備(104)的監視器上顯示的搜索查詢域中輸入搜索查詢。基于搜索查詢術語,查詢計劃生成器生成多個查詢計劃,多個查詢計劃可用于搜索數據庫(100)以從數據庫的內容中找到適當的搜索結果。查詢計劃優化器選擇查詢計劃優化器確定將用最短的時間搜索數據庫內容的多個查詢計劃中的一個。查詢計劃優化器至少部分地基于存儲在數據庫(100)中和描述數據庫內容的統計做出決定以選擇查詢計劃。例如,數據庫(100)可存儲直方圖、行計數、唯一條目計數、其它統計或其組合,以描述數據庫(100)中的列信息。此統計使查詢計劃優化器免于重新計算關于列中的數據的摘要信息。
在數據庫的數據存在很小的變換時,關于數據庫列的統計可基于樣本被估計,以避免數據可使用大量的資源來更新大量的統計。數據庫(100)包括更新系統(106),更新系統(106)在適當的時候更新描述數據庫列的至少之一的統計的至少之一。更新統計的適當時間是在統計分布具有統計改變時。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于惠普發展公司;有限責任合伙企業,未經惠普發展公司;有限責任合伙企業許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380076186.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能倉庫管理控制系統
- 下一篇:一種智能卡信息識別錄入系統





