[發(fā)明專利]基于數(shù)據(jù)倉庫構(gòu)建主題模型的方法、裝置以及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010555963.3 | 申請(qǐng)日: | 2020-06-17 |
| 公開(公告)號(hào): | CN113806391A | 公開(公告)日: | 2021-12-17 |
| 發(fā)明(設(shè)計(jì))人: | 寧任聲 | 申請(qǐng)(專利權(quán))人: | 北京滴普科技有限公司 |
| 主分類號(hào): | G06F16/242 | 分類號(hào): | G06F16/242;G06F16/22;G06F16/25;G06Q10/06 |
| 代理公司: | 北京萬思博知識(shí)產(chǎn)權(quán)代理有限公司 11694 | 代理人: | 劉冀 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 數(shù)據(jù)倉庫 構(gòu)建 主題 模型 方法 裝置 以及 存儲(chǔ) 介質(zhì) | ||
1.一種基于數(shù)據(jù)倉庫構(gòu)建主題模型的方法,其特征在于,包括:
接收用于創(chuàng)建主題模型的主題模型參數(shù)信息,其中所述主題模型用于通過面向主題的方式對(duì)數(shù)據(jù)倉庫中與預(yù)定業(yè)務(wù)相關(guān)的數(shù)據(jù)進(jìn)行分析;
根據(jù)所述主題模型參數(shù)信息,確定用于創(chuàng)建所述主題模型的指標(biāo)模型,其中所述指標(biāo)模型為用于對(duì)所述預(yù)定業(yè)務(wù)進(jìn)行分析的指標(biāo)所對(duì)應(yīng)的邏輯模型;
根據(jù)所述指標(biāo)模型創(chuàng)建所述主題模型;
創(chuàng)建與所述主題模型綁定的物理模型以及在物理數(shù)據(jù)庫中創(chuàng)建與所述物理模型綁定的數(shù)據(jù)表結(jié)構(gòu),其中所述數(shù)據(jù)表結(jié)構(gòu)用于構(gòu)建所述數(shù)據(jù)倉庫;以及
執(zhí)行與所述數(shù)據(jù)表結(jié)構(gòu)相關(guān)的ETL任務(wù),生成與所述主題模型相關(guān)的數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的的方法,其特征在于,還包括:
根據(jù)所述主題模型參數(shù)信息,確定與所述主題模型相關(guān)聯(lián)的匯總粒度,其中所述匯總粒度用于對(duì)根據(jù)所述主題模型所確定的數(shù)據(jù)進(jìn)行匯總;以及
根據(jù)所述主題模型參數(shù)信息,確定與所述主題模型相關(guān)聯(lián)的數(shù)據(jù)范圍,其中所述數(shù)據(jù)范圍用于對(duì)根據(jù)所述主題模型所確定的數(shù)據(jù)進(jìn)行篩選,并且其中
根據(jù)所述指標(biāo)模型創(chuàng)建所述主題模型的操作,包括:根據(jù)所述指標(biāo)模型、所述匯總粒度以及所述數(shù)據(jù)范圍,創(chuàng)建所述主題模型。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述指標(biāo)模型為單個(gè)指標(biāo)模型的情況下,確定與所述主題模型相關(guān)聯(lián)的匯總粒度的操作,包括:
確定所述指標(biāo)模型的維度,其中所述指標(biāo)模型的維度用于確定所述指標(biāo)模型的統(tǒng)計(jì)粒度;以及
根據(jù)所述主題模型參數(shù)信息,從所述指標(biāo)模型的維度中選取至少一部分維度確定所述匯總粒度。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述指標(biāo)模型為多個(gè)指標(biāo)模型的情況下,確定與所述主題模型相關(guān)聯(lián)的匯總粒度的操作,包括:
確定所述多個(gè)指標(biāo)模型的維度,其中多個(gè)指標(biāo)模型的維度用于確定所述多個(gè)指標(biāo)模型的統(tǒng)計(jì)粒度;
根據(jù)所述多個(gè)指標(biāo)模型的維度,確定所述多個(gè)指標(biāo)模型的公共維度,其中所述公共維度為所述多個(gè)指標(biāo)模型所公有的維度;以及
根據(jù)所述主題模型參數(shù)信息,從所述公共維度中選取至少一部分維度確定所述匯總粒度。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,確定與所述主題模型相關(guān)聯(lián)的數(shù)據(jù)范圍的操作,包括:
接收用于確定所述數(shù)據(jù)范圍的SQL條件;以及
根據(jù)SQL條件,對(duì)所述指標(biāo)模型相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行篩選,確定與所述主題模型相關(guān)聯(lián)的數(shù)據(jù)范圍。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,創(chuàng)建與所述主題模型綁定的物理模型以及與所述物理模型綁定的數(shù)據(jù)表結(jié)構(gòu)的操作,包括:
根據(jù)所述指標(biāo)模型創(chuàng)建所述物理模型,其中所述物理模型的字段包括所述指標(biāo)模型的度量和/或維度;以及
根據(jù)所述物理模型的字段在所述物理數(shù)據(jù)庫中創(chuàng)建所述數(shù)據(jù)表結(jié)構(gòu)。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,執(zhí)行與所述數(shù)據(jù)表結(jié)構(gòu)相關(guān)的ETL任務(wù),生成與所述主題模型相關(guān)的數(shù)據(jù)的操作,包括:
根據(jù)所述指標(biāo)模型、所述匯總粒度以及所述數(shù)據(jù)范圍生成所述ETL任務(wù);以及
調(diào)度運(yùn)行所述ETL任務(wù),生成與所述主題模型相關(guān)的數(shù)據(jù)。
8.一種存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在所述程序運(yùn)行時(shí)由處理器執(zhí)行權(quán)利要求1至7中任意一項(xiàng)所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京滴普科技有限公司,未經(jīng)北京滴普科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010555963.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于進(jìn)行數(shù)據(jù)倉儲(chǔ)的設(shè)備和方法
- 用于進(jìn)行數(shù)據(jù)倉儲(chǔ)的系統(tǒng)和方法
- 同步構(gòu)建業(yè)務(wù)模型和數(shù)據(jù)倉庫模型及其映射的方法及系統(tǒng)
- 一種構(gòu)建數(shù)據(jù)倉庫表血緣關(guān)系圖的方法和裝置
- 一種數(shù)據(jù)倉庫性能測試方法及系統(tǒng)
- 一種老年健康監(jiān)護(hù)系統(tǒng)用數(shù)據(jù)及資源存儲(chǔ)層
- 數(shù)據(jù)模型生成方法和數(shù)據(jù)倉庫生成方法、裝置及電子設(shè)備
- 一種解耦合的彈性數(shù)據(jù)倉庫架構(gòu)
- 數(shù)據(jù)同步方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種數(shù)據(jù)倉庫管理方法及系統(tǒng)
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





