[發明專利]數據倉庫的構建方法、裝置、設備及存儲介質有效
| 申請號: | 202110065923.5 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN112860659B | 公開(公告)日: | 2023-09-01 |
| 發明(設計)人: | 王建興;張曉明;王旭;張雪純 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06F16/28 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 盧萬騰;吳雪 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據倉庫 構建 方法 裝置 設備 存儲 介質 | ||
1.一種數據倉庫的構建方法,其特征在于,包括:
獲取第i個業務線的業務數據,其中,i=1,2,3……,N,N為正整數;所述第i個業務線的業務數據包括至少一個業務過程被調用時產生的調用數據;
從所述業務數據中提取所述第i個業務線的業務明細,包括:從所述業務數據中提取第j個業務過程被調用時產生的調用數據,得到目標調用數據,其中,j=1,2,3……,M,M為正整數;將所述目標調用數據進行存儲,得到第j個業務過程的業務過程明細;將M個業務過程與所述第i個業務線進行映射,得到第i個業務線與M個業務過程的映射關系;將所述映射關系以及M個業務過程的業務過程明細確定為所述第i個業務線的業務明細;
將第i個業務線的業務明細按照預先確定的第一主題進行劃分,得到所述第一主題的業務層表;
確定所述第一主題的過程包括:將M個業務過程以及每個業務過程的業務過程明細輸入到預先訓練的業務過程劃分模型中,根據業務過程明細對所述M個業務過程進行劃分,得到至少一組業務過程;將每組業務過程歸類為一個第一主題;
所述將第i個業務線的業務明細按照預先確定的第一主題進行劃分,得到所述第一主題的業務層表,包括:針對任一所述第一主題,從預設的指標度量層獲取與所述第一主題對應的至少一個第一指標,以及從預設的維度層獲取與所述第一主題對應的第一數據維度;將歸類為所述第一主題的業務過程確定為第一目標業務過程;根據所述第一指標從所述第i個業務線的所述第一目標業務過程的業務過程明細中提取調用數據,得到第一目標明細;按照所述第一數據維度,將所述第一目標明細中的所有調用數據整合為所述第一主題的業務層表;
將N個業務線的業務明細按照預先確定的第二主題進行匯總,得到所述第二主題的主題層表;
基于所述業務層表和所述主題層表構建所述數據倉庫。
2.根據權利要求1所述的方法,其特征在于,確定所述第二主題的過程包括:
根據所述映射關系確定N個業務線均包括的至少一個第二目標業務過程;
針對任一所述第二目標業務過程,根據所述第二目標業務過程的屬性確定所述第二目標業務過程對應的所述第二主題。
3.根據權利要求2所述的方法,其特征在于,所述將N個業務線的業務明細按照預先確定的第二主題進行匯總,得到所述第二主題的主題層表,包括:
針對任一所述第二主題,從預設的指標度量層獲取與所述第二主題對應的至少一個第二指標,以及從預設的維度層獲取與所述第二主題對應的第二數據維度;
根據每個所述第二指標分別從N個業務線的業務明細中提取與所述第二主題對應的所述第二目標業務過程的業務過程明細,得到每個業務線的第二目標明細;
按照所述第二數據維度,將每個業務線的所述第二目標明細整合為所述第二主題的主題層表。
4.根據權利要求1、3任一項所述的方法,其特征在于,所述基于所述業務層表和所述主題層表構建所述數據倉庫,包括:
將第i個業務線與第一主題的業務層表進行映射存儲,得到所述數據倉庫的業務集市層;
按照預設的主題歸類方式將第二主題的主題層表與預設的主題域進行映射,得到所述數據倉庫的主題集市層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110065923.5/1.html,轉載請聲明來源鉆瓜專利網。





