[發明專利]一種應用于電子郵箱地址的字符編碼方法及系統在審
| 申請號: | 201910091848.2 | 申請日: | 2019-01-30 |
| 公開(公告)號: | CN109660262A | 公開(公告)日: | 2019-04-19 |
| 發明(設計)人: | 謝文輝;王敏;劉江橋;張浩;汪翔;楊柳;周期律;常學亮;張軼;孫光輝;羅春江;劉引;汪哲逸 | 申請(專利權)人: | 重慶農村商業銀行股份有限公司 |
| 主分類號: | H03M7/40 | 分類號: | H03M7/40 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 李英 |
| 地址: | 400000 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子郵箱地址 字符編碼 二進制 霍夫曼編碼 自定義 應用 實際生產數據 服務器定義 編碼過程 編碼效率 電子郵箱 原始空間 移位 脫敏 | ||
本發明公開了一種應用于電子郵箱地址的字符編碼方法及系統,進行以下步驟:將電子郵箱地址按照字符拆分為用戶自定義部分和服務器定義部分;將電子郵箱地址的用戶自定義部分通過霍夫曼編碼方法進行編碼。本發明解決了現有技術存在的對電子郵箱的脫敏方法在字符編碼過程中效率不高、耗費空間的問題,提供一種應用于電子郵箱地址的字符編碼方法,其應用時編碼過程,都是可以通過移位,與,或等二進制操作來完成,目前CPU中,執行二進制操作是非常高效的,提升編碼效率,由于霍夫曼編碼表是根據實際生產數據而得出的編碼,因此使用該編碼對整個庫的郵箱編碼后得到的二進制大小比原始空間可以節省大量空間。
技術領域
本發明涉及字符編碼領域,具體涉及一種應用于電子郵箱地址的字符編碼方法及系統。
背景技術
由于銀行的數據庫系統中,存有大量的個人的隱私敏感信息。而在銀行的日常工作中,又時刻需要各種數據來開展工作,數據泄露的風險很大,所以需要對敏感信息進行加工處理,隱藏隱私敏感數據。
電子郵箱地址對于個人來是一個比較重要的隱私信息,不僅通過該郵箱可以聯系到所有者,而且很多網站,手機端的app應用都是可以通過郵箱綁定,甚至一些重要的賬號找回功能也可以通過郵箱來重置。目前電子郵箱地址由于不太重視,脫敏方法較為簡單主要分為下面幾類:
1、符號替換法,直接以特殊符號(如*)把所有(或部分)字母替換。
2、編碼移位法,將各個字母的編碼移動固定位數,如a移位變成b,b移位變成c。
上面幾種方法存在一些缺點,第一種可以有效隱藏敏感信息,但是由于其替換后多個郵箱地址對應同一個編碼后的地址,打破數據的關聯關系,如兩張數據表有相同地址的郵箱,實施該方法脫敏后,分析人員無法知道兩條數據對應的是同一個地址。第二種保持了一對一的關聯關系,但是容易從已知的脫敏結果中推算出偏移的參數,從而得到原數據。
發明內容
本發明解決了現有技術存在的對電子郵箱的脫敏方法在字符編碼過程中效率不高、耗費空間的問題,提供一種應用于電子郵箱地址的字符編碼方法及系統,其應用時編碼過程,都是可以通過移位,與,或等二進制操作來完成,目前CPU中,執行二進制操作是非常高效的,提升編碼效率,由于霍夫曼編碼表是根據實際生產數據而得出的編碼,因此使用該編碼對整個庫的郵箱編碼后得到的二進制大小比原始空間可以節省大量空間。
本發明通過下述技術方案實現:
一種應用于電子郵箱地址的字符編碼方法,進行以下步驟:
A、將電子郵箱地址按照字符拆分為用戶自定義部分和服務器定義部分;
B、將電子郵箱地址的用戶自定義部分通過霍夫曼編碼方法進行編碼。
本發明提供的電子郵箱地址脫敏方法的編碼步驟如下:
拆分--編碼--壓縮
首先根據郵箱地址的@符號,將郵箱的用戶名與域名拆開。根據業務場可以按需用戶名和域名分別進行脫敏或僅對用戶名進行脫敏。本發明中,按僅對用戶名進行脫敏來闡述原理。
編碼、壓縮
電子郵箱地址字符允許的字符為字母、數字、句點、連字符或下劃線五類共出39個字符(英文字母不區分大小寫)。其頻率特征較為明顯,經申請人統計,排名前6位的字母出現頻率加起來超過了50%,因此本發明利用在壓縮領域廣泛應用的霍夫曼編碼算法可以有效地對郵箱地址進行壓縮存儲。
霍夫曼編碼原理:霍夫曼編碼是一種異字頭的變字長編碼,基本原理用最短的編碼表示頻率最高的字符,頻率最低的字符用最長的編碼表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶農村商業銀行股份有限公司,未經重慶農村商業銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910091848.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據壓縮
- 下一篇:一種適用于MLC NAND閃存的LDPC碼譯碼方法





