[發明專利]一種基于大數據和預計算的熱線分析方法及模型在審
| 申請號: | 202011635194.4 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112685421A | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 李冬 | 申請(專利權)人: | 浪潮云信息技術股份公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/242;G06F16/2458;G06F16/25;G06F16/248;G06F16/182 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 馮春連 |
| 地址: | 250100 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 預計 熱線 分析 方法 模型 | ||
1.一種基于大數據和預計算的熱線分析方法,其特征在于,該方法的實現包括:
獲取歷史熱線工單數據,對獲取數據進行預處理;
在分析型數據倉庫kylin中加載預處理后的數據,構建維度和度量的組合,利用MapReduce程序將所構建緯度和度量的組合進行預計算,得出所有維度和度量組合的統計結果,將統計結果存儲在分布式列式數據庫Hbase中;
在前端開發一個自由選擇拖拉拽的維度和度量組件、以及統計組件,該維度和度量組件可以根據獲取的維度、度量字段生成相應的查詢Json數據的程序,并將json數據發送到后端;
在后端開發一個解析查詢組件,該解析查詢組件以設定的規則將收到的json數據解析成分析型數據倉庫Kylin可以識別的查詢語句,并隨后調用分析型數據倉庫kylin的Jdbc接口,從分布式列式數據庫Hbase中獲取與接收數據相對應的預計算結果,并返回前端的統計組件生成熱線分析指標。
2.根據權利要求1所述的一種基于大數據和預計算的熱線分析方法,其特征在于,歷史熱線工單數據存儲在分布式存儲系統HDFS中,分布式存儲系統HDFS的歷史熱線工單數據是從熱線系統中遷移過來的。
3.根據權利要求1所述的一種基于大數據和預計算的熱線分析方法,其特征在于,對獲取數據進行的預處理包括ETL操作和結構化映射。
4.根據權利要求3所述的一種基于大數據和預計算的熱線分析方法,其特征在于,對獲取數據進行ETL操作后,將數據的日期格式、關聯查詢字典、熱線數據、回訪數據、抽樣數據一一對應起來。
5.根據權利要求4所述的一種基于大數據和預計算的熱線分析方法,其特征在于,對獲取數據進行結構化映射的具體操作為:
利用大數據生態中的數據倉庫工具HIVE對ETL操作后的數據進行結構化映射,生成結構化json數據。
6.根據權利要求1所述的一種基于大數據和預計算的熱線分析方法,其特征在于,統計組件根據預計算結果生成的熱線分析指標不限于包括所選時間段內的熱線案件的數量、類別分布、處理時長分布、滿意率、解決率、先行聯系率,統計組件統計生成的所有熱線分析指標,并以多樣化的圖表進行展示。
7.一種基于大數據和預計算的熱線分析模型,其特征在于,該模型的構建過程包括:
(1)數據準備階段:獲取歷史熱線工單數據,對獲取數據進行預處理,在分析型數據倉庫kylin中加載預處理后的數據,構建維度和度量的組合,利用MapReduce程序將所構建緯度和度量的組合進行預計算,得出所有維度和度量組合的統計結果,將統計結果存儲在分布式列式數據庫Hbase中;
(2)模型構建階段,又包括:
部署在前端的可以自由選擇拖拉拽的維度和度量組件,該維度和度量組件可以根據獲取的維度、度量字段生成相應的查詢Json數據的程序,并將json數據發送到后端,
部署在后端的解析查詢組件,該解析查詢組件以設定的規則將收到的json數據解析成分析型數據倉庫Kylin可以識別的查詢語句,并隨后調用分析型數據倉庫kylin的Jdbc接口,從分布式列式數據庫Hbase中獲取與接收數據相對應的預計算結果,并返回前端,
部署在前端的統計組件,該統計組件根據預計算結果生成熱線分析指標。
8.根據權利要求7所述的一種基于大數據和預計算的熱線分析模型,其特征在于,歷史熱線工單數據存儲在分布式存儲系統HDFS中,分布式存儲系統HDFS的歷史熱線工單數據是從熱線系統中遷移過來的。
9.根據權利要求7所述的一種基于大數據和預計算的熱線分析模型,其特征在于,對獲取數據進行的預處理包括ETL操作,ETL操作后,將數據的日期格式、關聯查詢字典、熱線數據、回訪數據、抽樣數據一一對應起來;
對獲取數據進行的預處理還包括結構化映射,即利用大數據生態中的數據倉庫工具HIVE對ETL操作后的數據進行結構化映射,生成結構化json數據。
10.根據權利要求7所述的一種基于大數據和預計算的熱線分析模型,其特征在于,統計組件根據預計算結果生成的熱線分析指標不限于包括所選時間段內的熱線案件的數量、類別分布、處理時長分布、滿意率、解決率、先行聯系率,統計組件統計生成的所有熱線分析指標,并以多樣化的圖表進行展示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮云信息技術股份公司,未經浪潮云信息技術股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011635194.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鋰離子電池用隔膜及其制備方法
- 下一篇:一種含碳復合物牙膏及其制備方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





