[發(fā)明專利]用于在單聚集過程中載入多數(shù)據(jù)集市的方法和裝置無效
| 申請?zhí)枺?/td> | 00808023.2 | 申請日: | 2000-05-24 |
| 公開(公告)號: | CN1384939A | 公開(公告)日: | 2002-12-11 |
| 發(fā)明(設(shè)計)人: | 伊娃·曼-揚(yáng)謝;邁克爾·迪安·洛爾;詹姆斯·丹尼爾·阿塔韋 | 申請(專利權(quán))人: | 計算機(jī)合伙思維有限公司 |
| 主分類號: | G06F15/00 | 分類號: | G06F15/00;G06F17/30 |
| 代理公司: | 中國商標(biāo)專利事務(wù)所 | 代理人: | 徐小琴 |
| 地址: | 美國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 聚集 過程 載入 多數(shù) 集市 方法 裝置 | ||
發(fā)明的背景
本專利申請涉及載入數(shù)據(jù)集市的方法。
數(shù)據(jù)集市是一個數(shù)據(jù)庫或數(shù)據(jù)庫的集合,設(shè)計用來幫助經(jīng)理們對他們的商務(wù)活動做出戰(zhàn)略性的決定。而一個數(shù)據(jù)倉庫聯(lián)合了整個企業(yè)的數(shù)據(jù)庫,數(shù)據(jù)集市通常比較小并集中在一個特定的項(xiàng)目或部門。經(jīng)常是,數(shù)據(jù)集市是一個較大的數(shù)據(jù)倉庫的子集。Ramon?Barquin和HerbEdelstein編輯的《規(guī)劃和設(shè)計數(shù)據(jù)倉庫》(Prentice?Hall?PTR.ISBN?0-13-255746-0)介紹了數(shù)據(jù)集市的定義和用法。Ralph?Kimball編輯的《數(shù)據(jù)倉庫工具包》(John?Wiley?&?Sons.Inc。ISBN?0-471-13337-0)提供了對數(shù)據(jù)倉庫的背景和概念的良好的介紹。
建立一個成功的數(shù)據(jù)集市的第一步驟之一是正確地識別在一個商業(yè)結(jié)構(gòu)中的不同的維(dimension)和事實(shí)集(fact?set)。這通常被稱為“維建模”。每個維表示一個獨(dú)特的實(shí)體集合,其參與事實(shí)集,而獨(dú)立于其它維的實(shí)體。事實(shí)集通常包括事務(wù)數(shù)據(jù)(transactional?data),其中每個事務(wù)(或記錄)由實(shí)體的集合對每個維一個個地識別。圖1表示了一個超級市場的星型模式,其中星形模式是維建模過程的結(jié)果。
每個維是一個表,其中每個記錄包括一個唯一地表示每個實(shí)體的主鍵(或復(fù)合主鍵)和限定或描述相關(guān)實(shí)體(或主鍵)的屬性(attribute)列表。在事實(shí)表中的每個事實(shí)記錄應(yīng)包括一個外碼用于連接到每個維和表示事項(xiàng)處理數(shù)據(jù)的函數(shù)(measures)列表。因?yàn)榫S的大小通常比事實(shí)表小得多,維表通常不進(jìn)一步的規(guī)范化(normalized)。因此,通過規(guī)范化節(jié)約的空間并不顯著。并且,OLAP(聯(lián)機(jī)分析處理)查詢工具在查詢運(yùn)行期間連接規(guī)范化了的維并不節(jié)省時間。
理論上,在上述的星形模式的結(jié)構(gòu)中,OLAP工具可以直接查詢包含事項(xiàng)處理數(shù)據(jù)的數(shù)據(jù)倉庫。但是,為了達(dá)到高級查詢的快速響應(yīng)時間,例如,獲得一種特定品牌的產(chǎn)品在每個州的月銷售量的查詢,必須要求數(shù)據(jù)倉庫數(shù)據(jù)的預(yù)聚集。
為了聚集的目的,每個維定義有數(shù)據(jù)層。根據(jù)條件每層定義了一組維條目(entry)。例如,在圖1的商店維中,對不同的州定義有一個層,因此對每個具有至少一個商店的州層將包含一個聚集維記錄。換句話說,一個特定的州的聚集維表示在這個州的所有商店的聚集。同樣,我們可以在商店維中定義另一個城市層以便允許建立聚集維記錄,其中每個條目表示一個特定的城市中所有商店的聚集。
稱為輸入(或具體)層的層是最低的層并包括與輸入維層相同的記錄號。為聚集的目的由用戶指定的層稱為聚集層。每個聚集層根據(jù)層的條件包括不同的記錄數(shù)。例如,州層可能包含比城市層少的記錄。每個(輸入和聚集的)層是由一個層代碼唯一地表示。考慮到效率,層代碼通常用一整數(shù)表示。
在輸出事實(shí)數(shù)據(jù)中需要的聚集由來自每個維一個的層的組合來定義。用于定義聚集的層的組合還稱為層的交叉產(chǎn)品,以上述的星形模式中的查詢某州某品牌的產(chǎn)品月銷量為例,相關(guān)的層需要被定義從而根據(jù)三個特定的層的交叉產(chǎn)品,事項(xiàng)處理數(shù)據(jù)的聚集需要被要求。用戶可以定義一個它們需要聚集的交叉產(chǎn)品的列表。輸入層(或具體)的交叉產(chǎn)品表示輸入或具體(detail)事實(shí)數(shù)據(jù)。對于每個要被具體的輸入事實(shí)函數(shù)可能有一個或多個聚集表達(dá)式。一些常用的聚集表達(dá)式包括:max(最大),min(最小),average(平均),sum(求和),count(記數(shù)),weighted?average(加權(quán)平均)以及填入所聚集的數(shù)據(jù)的常量值。
在每個維中通常還提供有一個“全值”層,其具有包含所有維條目的單體。當(dāng)相關(guān)的維沒有包括在交叉產(chǎn)品中時,此層用在交叉產(chǎn)品中,從而對每個維的包含一個層可以定義交叉產(chǎn)品的單一格式。在交叉產(chǎn)品中增加一個“全條目”層對聚集的結(jié)果沒有影響,因此作為在交叉產(chǎn)品中的一個啞條目。例如,如果圖1的星形模式被使用,需要月交叉產(chǎn)品的城市。產(chǎn)品的“全條目”層將被結(jié)合到交叉產(chǎn)品中。實(shí)際上,所有產(chǎn)品的數(shù)據(jù)被月聚集記錄聚集到城市中。
在聚集處理之后,產(chǎn)生一個數(shù)據(jù)集市。每個數(shù)據(jù)集市包含一套維和事實(shí)表。在數(shù)據(jù)集市中的每個維對應(yīng)于在源星形模式中的一個維。在數(shù)據(jù)集市中的事實(shí)表包含特定交叉產(chǎn)品的列表的聚集數(shù)據(jù)。
由當(dāng)前受托者(assignee)提供的先前的產(chǎn)品是一項(xiàng)咨詢服務(wù),其識別在具體維記錄和聚集維記錄,事實(shí)數(shù)據(jù)聚集和聚集緯度和事實(shí)數(shù)據(jù)的分配之間的包含關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于計算機(jī)合伙思維有限公司,未經(jīng)計算機(jī)合伙思維有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/00808023.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計算機(jī)
G06F15-02 .通過鍵盤輸入的手動操作,以及應(yīng)用機(jī)內(nèi)程序的計算,例如,袖珍計算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時,進(jìn)行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個或多個數(shù)字計算機(jī)的組合,其中每臺至少具有一個運(yùn)算器、一個程序器及一個寄存器,例如,用于數(shù)個程序的同時處理
G06F15-18 .其中,根據(jù)計算機(jī)本身在一個完整的運(yùn)行期間內(nèi)所取得的經(jīng)驗(yàn)來改變程序的;學(xué)習(xí)機(jī)器





