[發明專利]數據處理方法和裝置有效
| 申請號: | 202010190814.1 | 申請日: | 2020-03-18 |
| 公開(公告)號: | CN111428251B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 李亞南;池宗洋;賈文玉;李偉;張曉波 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 張建秀;龍洪 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 | ||
1.一種數據處理方法,包括:
在接收到符合核心數據的判斷條件的待處理數據后,獲取所述待處理數據的內容的特征信息;
根據所述內容的特征信息,從預先存儲的數據模擬策略中,確定所述內容的特征信息對應的目標數據模擬策略;
利用所述目標數據模擬策略對所述待處理數據進行處理,得到模擬數據,其中所述模擬數據與所述待處理數據的數據格式相同,且所述模擬數據與所述待處理數據的內容的相似度符合預先設置的相似度高的判斷條件;
輸出所述模擬數據;
其中,所述數據模擬策略是通過如下方式得到,包括:
獲取等待執行模擬操作的數據,得到樣本數據集,其中所述樣本數據集包括N條數據;
將所述樣本數據中每條數據切分成m份,并提取出m份規則,其中M為正整數;
在得到N條數據中每條數據對應的m份規則后,從N*m條規則中選擇X條規則作為所述樣本數據集對應的候選規則;
分別利用每條候選規則對所述樣本數據集中的數據進行處理,得到每個候選規則對應的模擬數據,并計算所述模擬數據與樣本數據集中的數據的相似度信息;
如果X條候選規則中有規則能使模擬數據與樣本數據集中的數據的相似度信息滿足所述相似度高的判斷條件,則確定該規則為該樣本數據集對應的數據模擬策略;否則,重新選擇所述X條候選規則,再進行數據模擬操作,直到有規則能使模擬數據與樣本數據集中的數據的相似度信息滿足所述相似度高的判斷條件為止;
其中,N、m和X均為正整數;
其中,所述數據模擬策略包括如下至少一個,包括:
同源模擬,按照待處理數據的生成算法,生成一組新的數據,作為所述待處理數據的模擬數據;
數據移位,按照所述待處理數據的數據分布規則,對所述待處理數據中的內容進行移位操作,得到所述待處理數據的模擬數據;
格式模擬,將待處理數據中符合預設的第一內容格式的目標內容替換為符合預設的第二內容格式的內容,作為所述待處理數據的模擬數據;
順序混淆,將所述待處理的數據內容進行重新排序,將重新排序后的內容作為待處理數據的模擬數據。
2.根據權利要求1所述的方法,其特征在于,所述X條候選規則是通過如下方式得到的,包括:
獲取所述N*m條規則中每條規則的權重;
根據每條規則的權重,計算每個規則的加權平均值;
利用每個規則的加權平均值對規則進行排序,選擇加權平均值最大的X個規則作為候選規則。
3.根據權利要求1或2所述的方法,其特征在于,所述數據模擬策略是根據數據的內容、數據分布特征、數據格式和數據的敏感度中至少一個信息確定的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010190814.1/1.html,轉載請聲明來源鉆瓜專利網。





