[發明專利]數據標記化的沖突處理方法及裝置在審
| 申請號: | 201710374968.4 | 申請日: | 2017-05-24 |
| 公開(公告)號: | CN107294956A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 劉敬良;黃凌志 | 申請(專利權)人: | 北京奇安信科技有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F17/27;G06F17/30;G06F21/62 |
| 代理公司: | 北京智匯東方知識產權代理事務所(普通合伙)11391 | 代理人: | 康正德,孫曉芳 |
| 地址: | 100015 北京市朝陽區酒仙*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 標記 沖突 處理 方法 裝置 | ||
技術領域
本發明涉及計算機技術領域,特別是涉及一種數據標記化的沖突處理方法及裝置。
背景技術
隨著計算機技術的不斷發展,利用計算機處理業務數據已經涉及到生活、工作、學習等各個方面,例如銀行業務辦理、平臺的登錄、用戶信息統計等等。由此,在對數據進行處理的過程中,數據的安全性以及有效性就顯得尤為重要。
采用現有技術對數據進行處理時,往往是對業務數據進行標記化以得到相應的字符串,但是,標記化后的字符串中并沒有有效地保留業務數據的重要字段信息。但是,在某些業務當中,需要對業務數據的重要字段做校驗,如果標記化后的字符串中沒有保留業務數據的重要字段,就很容易導致數據的校驗失敗,從而無法完成數據提交和處理。
此外,在現有技術中,對數字進行標記化之后依然是數字,這種特性容易導致數據的沖突性問題,即不同的數字在標記化后可能得到相同的標記化數字,而數據沖突可能會導致去標記化后的數據并非原始的業務數據,從而造成業務數據的錯誤,帶來不必要的麻煩。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的數據標記化的沖突處理方法及裝置。
依據本發明的一方面,提供了一種數據標記化的沖突處理方法,包括:
接收原始數據,并解析獲得所述原始數據的數據類型;
根據預先配置的策略選取與所述原始數據的數據類型匹配的標記化算法;
依據選取的標記化算法對所述原始數據進行標記化處理,得到所述原始數據轉換的標記化數據;
判斷所述標記化數據與本地數據庫中已存儲的其他標記化數據是否沖突;
若沖突,則依據特定規則對所述標記化數據進行調整,生成新的標記化數據,且所述新的標記化數據與沖突的標記化數據不同。
可選地,所述依據選取的標記化算法對所述原始數據進行標記化處理,得到所述原始數據轉換的標記化數據,包括:
依據選取的標記化算法對所述原始數據本身進行轉換,得到轉換后的數字字符串;
為所述轉換后的數字字符串添加校驗符,得到所述原始數據轉換的標記化數據。
可選地,所述為所述轉換后的數字字符串添加校驗符,包括:
為所述轉換后的數字字符串添加用于識別業務的特征標識;和/或
為所述轉換后的數字字符串添加所述選取的標記化算法標識。
可選地,所述為所述轉換后的數字字符串添加校驗符,得到所述原始數據轉換的標記化數據,包括:
在所述轉換后的數字字符串的頭部添加用于識別業務的特征標識,在所述轉換后的數字字符串的尾部添加所述選取的標記化算法標識,結合頭部、尾部以及所述轉換后的數字字符串得到所述原始數據轉換的標記化數據。
可選地,所述用于識別業務的特征標識長度為6個字節;
所述選取的標記化算法標識長度為3個字節。
可選地,所述判斷所述標記化數據與本地數據庫中已存儲的其他標記化數據是否沖突,包括:
從所述本地數據庫中查找是否存在與所述標記化數據相同的其他標記化數據;
若存在,則進一步判斷所述原始數據與所述其他標記化數據所對應的原始數據是否相同;
若是,則所述標記化數據與所述其他標記化數據不沖突;
若否,則所述標記化數據與所述其他標記化數據沖突。
可選地,所述本地數據庫中預先保存了所述其他標記化數據和與其對應的原始數據之間的映射關系,判斷所述原始數據與所述其他標記化數據所對應的原始數據是否相同,包括:
依據本地數據庫中已存儲的映射關系獲取與所述其他標記化數據對應的原始數據;
判斷所述原始數據與獲取的所述其他標記化數據所對應的原始數據是否相同。
可選地,若所述本地數據庫中不存在與所述標記化數據相同的其他標記化數據,則所述標記化數據與其他標記化數據不沖突。
可選地,所述判斷所述標記化數據與本地數據庫中已存儲的其他標記化數據是否沖突,包括:
獲取所述本地數據庫中已存儲的沖突位為1的標記化數據,其中,所述沖突位為1的標記化數據為已經進行過沖突判定的標記化數據;
從獲取的沖突位為1的標記化數據中查找是否存在與所述標記化數據相同的其他標記化數據;
若存在,則進一步判斷所述原始數據與所述沖突位為1的標記化數據所對應的原始數據是否相同;
若是,則所述標記化數據與所述其他標記化數據不沖突,并將所述標記化數據的沖突位置1;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇安信科技有限公司,未經北京奇安信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710374968.4/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





