[發明專利]數據壓縮方法及設備有效
| 申請號: | 201310561146.9 | 申請日: | 2013-11-12 |
| 公開(公告)號: | CN104636377B | 公開(公告)日: | 2018-09-07 |
| 發明(設計)人: | 權寧強;劉凱 | 申請(專利權)人: | 華為技術服務有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H03M7/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 065000 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 匹配 數據包 哈希 概率 編碼符號 輸出編碼 數據壓縮 算術編碼 定長 字段 概率確定 關鍵字段 哈希運算 數據文件 統計分析 哈希表 壓縮比 排序 | ||
本發明實施例提供一種數據壓縮方法及設備。方法包括:通過統計分析獲取多個CHR/MR數據包包含的相同定長字段在CHR/MR數據文件中出現的概率;根據該概率確定至少一個關鍵字段,按照關鍵字對多個CHR/MR數據包進行排序;依次對每個CHR/MR數據包包含的每個定長字段進行哈希運算,將哈希值與哈希表中的哈希值進行匹配,如果匹配中,增大匹配中的哈希值對應的編碼符號的概率,利用增大后的概率進行算術編碼并輸出編碼符號;如果未匹配中,利用編碼符號的默認概率進行算術編碼并輸出編碼符號。本發明技術方案可以進一步提高對CHR/MR數據的壓縮比。
技術領域
本發明實施例涉及通信技術,尤其涉及一種數據壓縮方法及設備。
背景技術
在無線通信網絡中,當用戶設備(User Equipment,簡稱為UE)需要通信的時候,會和基站完成認證、鑒權等流程,之后UE所發送的信令消息通過基站,在無線通信網絡中的承載網上傳輸到接收方。在該過程中,UE隨時與基站保持通信,會產生大量的呼叫歷史記錄(Call History Record,簡稱為CHR)和測量報告(Measurement Report,簡稱為MR)數據,這些CHR/MR數據保存在基站控制器上。根據需要,基站控制器會將CHR/MR數據傳輸到數據采集服務器上,之后數據采集服務器將CHR/MR數據上傳到云數據中心,使得在云數據中心能夠基于CHR/MR數據提供運維增值服務。
隨著無線通信網絡的快速發展,UE數量激增,CHR/MR數據大幅增長,海量CHR/MR數據的產生與云數據中心的有限網絡帶寬之間矛盾日趨凸顯,過長的CHR/MR數據上傳時間已成為制約云數據中心處理效率的瓶頸。將海量CHR/MR數據進行壓縮編碼以提升傳輸效率,是應對這一難題的一條有效途徑。其中,算術編碼是目前用于對海量CHR/MR數據進行壓縮編碼的一種有效方法,主要是將被編碼的一條消息或字符串表示成0與l之間的一段間隔,即對一串符號直接編碼成[0,1)區間上的一個浮點小數,從而避開了用一個特定碼字代替一個輸入符號的思想,而是用一個單獨的浮點數來代替一串輸入符號,克服了霍夫曼(Huffman)編碼中比特數必須取整的缺點,有效地提高了數據的壓縮比。
目前,基于算術編碼的數據壓縮過程是:以被壓縮數據中連續的多個字節數據建立上下文,獲得被壓縮數據的概率分布情況,在得到被壓縮數據的概率分布情況下獲取接近信息熵,這種方法適用于各種通用數據,但是用于對CHR/MR數據進行壓縮時,壓縮后的數據仍存在數據冗余,壓縮比有待進一步提高。
發明內容
本發明實施例提供一種數據壓縮方法及設備,用以進一步提高對CHR/MR數據的壓縮比。
第一方面提供一種數據壓縮方法,包括:
按照預定格式,對呼叫歷史記錄/測量報告CHR/MR數據文件包含的多個CHR/MR數據包進行統計分析,獲取所述多個CHR/MR數據包包含的相同定長字段在所述CHR/MR數據文件中出現的概率;
根據所述多個CHR/MR數據包包含的相同定長字段在所述CHR/MR數據文件中出現的概率,從所述多個CHR/MR數據包包含的相同定長字段中確定至少一個關鍵字段,并按照所述至少一個關鍵字段,對所述多個CHR/MR數據包進行排序;
按照排序后的多個CHR/MR數據包的先后順序,依次對每個CHR/MR數據包包含的每個定長字段進行哈希運算,將所述定長字段的哈希值與所述定長字段對應的哈希表中的哈希值進行匹配,如果匹配中,將所述定長字段對應的哈希表中匹配中的哈希值對應的編碼符號的概率增大,以增大后的概率作為算術編碼的輸入參數,對所述定長字段進行算術編碼并輸出所述定長字段對應的編碼符號;如果未匹配中,將所述定長字段的哈希值添加到所述定長字段對應的哈希表中,以所述定長字段的哈希值對應的編碼符號的默認概率作為算術編碼的輸入參數,對所述定長字段進行算術編碼輸出所述定長字段對應的編碼符號;其中,所述多個CHR/MR數據包包含的相同定長字段對應同一哈希表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術服務有限公司,未經華為技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310561146.9/2.html,轉載請聲明來源鉆瓜專利網。





