[發明專利]一種OLAP多維分析和數據挖掘系統在審
| 申請號: | 201710966150.1 | 申請日: | 2017-10-17 |
| 公開(公告)號: | CN107704608A | 公開(公告)日: | 2018-02-16 |
| 發明(設計)人: | 竇志成;謝峰;肖超峰;曾澤群 | 申請(專利權)人: | 北京一覽群智數據科技有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中創陽光知識產權代理有限責任公司11003 | 代理人: | 尹振啟 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 olap 多維 分析 數據 挖掘 系統 | ||
1.一種OLAP多維分析和數據挖掘系統,其特征在于,具有數據模型、分布式OLAP引擎、OLAP解析引擎、多維分析報表接口、數據挖掘接口和數據可視化工具,所述數據模型由可視化界面供用戶通過拖拽完成數據建模,具有統一的模型配置,系統自動進行模型適配,使數據模型配合內部其他引擎或工具調用;所述分布式OLAP引擎為OLAP系統提供多維數據模型預處理能力;所述OLAP解析引擎支持大數據平臺和關系型數據庫的多維度查詢解析引擎,將MDX語句解析為標準的SQL語言;所述多維分析報表接口和數據挖掘接口具有多維度的數據分析和數據挖掘功能,提供報表分析方法和數據挖掘算法模型;所述數據可視化工具為多維分析報表接口和數據挖掘接口中的報表分析和數據挖掘提供可視化操作,并提供可視化結果社交分享和圖表管理功能。
2.如權利要求1所述的方法,其特征在于,所述數據模型構建的過程的前后順序為:建立數據表、配置數據源、加載數據表、選擇事實表和維表、選擇維度和指標最終建立模型;所述數據源包括關系型數據庫以及大數據平臺的Hive數據倉庫。
3.如權利要求2所述的方法,其特征在于,針對不同數據源所適配的配置文件不同,為使其格式化和規范化,在前端頁面進行配置時該方法能讓用戶進行統一的配置,而不需針對不同的數據源進行配置,配置的步驟包括:步驟1,數據源配置文件的格式抽取;步驟2,配置文件的格式化處理;步驟3,配置文件的生成。
4.如權利要求1所述的方法,其特征在于,所述分布式OLAP引擎在大數據平臺上構建數據立方體對大規模數據處理,并基于數據立方體,提供實時的查詢統計,對存儲在大數據平臺中的大規模數據進行預處理,將數據進行提取、篩選和匯總,構建數據立方體并存儲,供上層模塊直接對結果數據進行查詢。
5.如權利要求1所述的方法,其特征在于,所述多維分析報表接口可以通過拖拽來快速生成報表,報表生成后,通過調用接口中的方法,可對報表數據進行鉆取、上卷、切片、切塊、旋轉、過濾、排序、基本數理統計和數據導出操作,讓數據更精準更有意義地呈現給用戶。所述對報表數據的鉆取為在維的不同層次間,對報表中匯總數據的拆分,得到更細節的報表數據,所述對報表數據的上卷為鉆取的逆向操作,對報表中細節的數據和分散的數據進行匯總,所述對報表數據的切片提供選擇報表數據中特定的值進行分析,所述對報表數據的切塊提供選擇報表中特定區間的數據進行分析,所述對報表數據的旋轉對報表數據行列互換,重新生成報表數據,所述對報表數據的過濾對報表數據過濾,進行特定條件的數據過濾,包括對調節為:大于、小于、等于、前十、后十和文本數據的勾選,所述對報表數據的排序對報表數據中數據進行升序或者降序排序,所述對報表數據的數理統計提供對報表數據進行均值、最大值、最小值、中值、方差和標準差的處理,所述對報表數據的數據導出對報表數據導出成csv、txt和excel等格式,供下載和保存。
6.如權利要求5所述的方法,所述拖拽的過程包括對象的定位、對象的抓取、對象的移動和對象實體的識別,拖拽的具體步驟為為:步驟1,通過鼠標單擊處位置的計算,判斷其位置是否具有對象,如果有對象,判斷該對象是否具有拖動的屬性;步驟2,當對象具有可拖動的屬性,通過鼠標的點擊和保持,保持該對象的持久性,并記錄該點的起始位置數據;步驟3,抓取后的對象通過鼠標的移動,動態的計算該對象的位置坐標,當釋放鼠標,判斷該對象最后的位置是否具有放置該對象的容器和屬性,如果具有放置的條件,則計算該對象的長、寬、高基本尺寸信息,結合現有的放置點所放置的對象信息,得到放置該對象的位置,通過類似于隊列的排列方式,放置該對象,完成對該對象的移動,如果最后的位置不具備放置該對象的容器和屬性,則返回起始位置點;步驟4,拖拽后的對象需進行識別,識別該對象中包含的實體,實體類型包括:行的名字、列的名字、指標的名字和數據庫表的名字等,在該識別的過程中,每個對象都具有唯一的類型標識,該標識在所有的動作中保持一致,使得前端和后端的能夠準確的識別。
7.如權利要求1所述的方法,其特征在于,所述數據挖掘接口提供了分類、聚類、回歸和預測模型的接口,每個預測模型接口下包含多種數據挖掘方式的實現,所述數據挖掘接口能夠根據數據的類型,調用最適合的數據挖掘模型接口,并可以通過配置參數調試數據挖掘的結果,所述模型包括Kmean聚類和多項式回歸。
8.如權利要求1所述的方法,其特征在于,所述可視化工具提供基本的圖表展示功能,2.5D數據可視化模型和3D數據可視化模型,對報表數據的分析,系統能夠根據數據的類型適配可視化模型呈現數據形態,數據可視化后的圖表結果保存在用戶的管理界面中,同時后臺保存相應的參數配置,對圖表局部放大,增加數據間的間隔,通過多種方式把當前報表分析圖表和數據挖掘可視化結果保存在網絡上。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京一覽群智數據科技有限責任公司,未經北京一覽群智數據科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710966150.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





