[發(fā)明專利]一種基于大數(shù)據(jù)并行運(yùn)算的語音信箱業(yè)務(wù)數(shù)據(jù)分析方法在審
| 申請?zhí)枺?/td> | 201610058065.0 | 申請日: | 2016-01-28 |
| 公開(公告)號: | CN105740397A | 公開(公告)日: | 2016-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 陳天橋;黃繼國;蒲明彬 | 申請(專利權(quán))人: | 廣州市訊飛樽鴻信息技術(shù)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 龔素琴 |
| 地址: | 510665 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 并行 運(yùn)算 語音信箱 業(yè)務(wù) 分析 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音信箱系統(tǒng)領(lǐng)域,更具體地,涉及一種基于大數(shù)據(jù)并行運(yùn)算的語音信箱業(yè)務(wù)數(shù)據(jù)分析方法。
背景技術(shù)
語音信箱技術(shù)是結(jié)合了移動互聯(lián)網(wǎng)領(lǐng)域、移動通信領(lǐng)域、以及傳統(tǒng)的電信智能網(wǎng)與數(shù)據(jù)網(wǎng)領(lǐng)域中的多種通訊技術(shù),為移動終端用戶提供語音留言的發(fā)送和收取服務(wù)的一種技術(shù)。基于語音信箱技術(shù)開發(fā)的語音郵件服務(wù)平臺能夠?qū)⒅鹘械恼Z音留言信息及時送達(dá)到接收者的終端設(shè)備上,使得人們之間的交流和溝通變得更加方便和高效。語音信箱技術(shù)是一項(xiàng)非常實(shí)用的技術(shù),使用語音信箱業(yè)務(wù)的移動終端用戶,在不方便接接聽電話的時候,主叫方通話可以被轉(zhuǎn)入語音信箱系統(tǒng),按照系統(tǒng)的提示音進(jìn)行操作,給被叫用戶錄下要說的話,存儲完成之后,系統(tǒng)將通過各種推送機(jī)制去通知被叫用戶有新的留言到達(dá)。被叫用戶在收到新留言達(dá)到通知信息后,可以到語音信箱系統(tǒng)后臺上對自己的語音留言數(shù)據(jù)進(jìn)行提取收聽,就不會錯過對方給自己的任何語音通話信息了,從而使得通信溝通效率得到提高。
語音信箱系統(tǒng)包括海量的用戶及業(yè)務(wù)數(shù)據(jù),傳統(tǒng)的基于數(shù)據(jù)庫的統(tǒng)計(jì)分析系統(tǒng)受制于日益龐大的數(shù)據(jù)量,面對移動互聯(lián)網(wǎng)動輒T級的落地?cái)?shù)據(jù)顯得有些力不從心,數(shù)據(jù)處理效率低下。
由此大數(shù)據(jù)并行運(yùn)算的統(tǒng)計(jì)分析系統(tǒng)應(yīng)運(yùn)而生,并很快成為目前比較前端的技術(shù)和發(fā)展的趨勢。基于hadoop離線集群的mapreduce運(yùn)算突破了傳統(tǒng)的數(shù)據(jù)庫統(tǒng)計(jì)分析的瓶頸,其具有強(qiáng)大的吞吐量以及方便的橫向縱向擴(kuò)展和并行的運(yùn)算能力,但其似乎采用的是一種蠻力方法,每個查詢都要處理整個數(shù)據(jù)集。
發(fā)明內(nèi)容
本發(fā)明為克服上述現(xiàn)有技術(shù)所述的數(shù)據(jù)處理效率低下、每個查詢都要處理整個數(shù)據(jù)集的缺陷,提供一種基于大數(shù)據(jù)并行運(yùn)算的語音信箱業(yè)務(wù)數(shù)據(jù)分析方法,該方法數(shù)據(jù)處理效率高、并且能夠避免一次查詢要處理整個數(shù)據(jù)集。
為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案如下:
一種基于大數(shù)據(jù)并行運(yùn)算的語音信箱業(yè)務(wù)數(shù)據(jù)分析方法,所述方法包括以下步驟:
S1:通過flume日志收集系統(tǒng)把語音信箱平臺業(yè)務(wù)系統(tǒng)的各核心組件拋出的結(jié)構(gòu)化日志匯聚到hadoop離線集群;
S2:通過MapReduce將當(dāng)天收集的原始日志生成或更新用戶模型數(shù)據(jù);
S3:用戶模型數(shù)據(jù)反更新當(dāng)天收集的日志生成相應(yīng)的流水模型數(shù)據(jù);
S4:查詢最新的用戶模型數(shù)據(jù)或者統(tǒng)計(jì)時間段內(nèi)的流水模型數(shù)據(jù)得出統(tǒng)計(jì)分析結(jié)果。
在一種優(yōu)選的方案中,步驟S1中,hadoop離線集群中所有日志都以key/value形式存儲,key為全球唯一標(biāo)識,value為分析統(tǒng)計(jì)關(guān)心字段的集合。
在一種優(yōu)選的方案中,所述核心組件包括IVRSERVER組件、IMSERVER組件、HTTPSERVER組件,各核心組件分別用于與用戶電話、APP、WEB進(jìn)行交互。
在一種優(yōu)選的方案中,步驟S2中,所述用戶模型數(shù)據(jù)以key/value形式存儲,key為對應(yīng)用戶的號碼,value為該用戶的屬性,一個用戶對應(yīng)一條記錄。
在一種優(yōu)選的方案中,所述統(tǒng)計(jì)分析結(jié)果為預(yù)設(shè)時間段內(nèi)業(yè)務(wù)的訂購用戶數(shù)。
在一種優(yōu)選的方案中,所述方法還包括以下步驟:
S5:通過JDBC(JavaDataBaseConnectivity,java數(shù)據(jù)庫連接)將統(tǒng)計(jì)分析結(jié)果插入數(shù)據(jù)庫,其目的是加快結(jié)果展示時的查詢效率;
S6:將數(shù)據(jù)庫中的統(tǒng)計(jì)分析結(jié)果通過JDBC發(fā)送到BAS展示系統(tǒng),統(tǒng)計(jì)分析結(jié)果通過BAS展示系統(tǒng)頁面進(jìn)行展示。
與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案的有益效果是:本發(fā)明提供一種基于大數(shù)據(jù)并行運(yùn)算的語音信箱業(yè)務(wù)數(shù)據(jù)分析方法,通過flume日志收集系統(tǒng)把語音信箱平臺業(yè)務(wù)系統(tǒng)的各核心組件拋出的結(jié)構(gòu)化日志匯聚到hadoop離線集群;通過MapReduce將當(dāng)天收集的原始日志生成或更新用戶模型數(shù)據(jù);用戶模型數(shù)據(jù)反更新當(dāng)天收集的日志生成相應(yīng)的流水模型數(shù)據(jù);查詢最新的用戶模型數(shù)據(jù)或者統(tǒng)計(jì)時間段內(nèi)的流水模型數(shù)據(jù)得出統(tǒng)計(jì)分析結(jié)果。業(yè)務(wù)統(tǒng)計(jì)分析時,避免一次查詢要處理整個數(shù)據(jù)集,既有效利用了大數(shù)據(jù)分析框架的并行運(yùn)算能力又巧妙地避免了蠻干。本發(fā)明方法,減少了查詢時間,提高了數(shù)據(jù)處理效率,適用于擁有海量的用戶及業(yè)務(wù)數(shù)據(jù)的語音信箱系統(tǒng)。
附圖說明
圖1為本發(fā)明基于大數(shù)據(jù)并行運(yùn)算的語音信箱業(yè)務(wù)數(shù)據(jù)分析方法的原理圖。
具體實(shí)施方式
附圖僅用于示例性說明,不能理解為對本專利的限制;對于本領(lǐng)域技術(shù)人員來說,附圖中某些公知結(jié)構(gòu)及其說明可能省略是可以理解的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州市訊飛樽鴻信息技術(shù)有限公司,未經(jīng)廣州市訊飛樽鴻信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610058065.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





