日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]數(shù)據(jù)預(yù)處理方法、裝置及系統(tǒng)有效

專利信息
申請?zhí)枺?/td> 201210567880.1 申請日: 2012-12-24
公開(公告)號: CN103077163A 公開(公告)日: 2013-05-01
發(fā)明(設(shè)計(jì))人: 王曉鋒 申請(專利權(quán))人: 華為技術(shù)有限公司
主分類號: G06F17/27 分類號: G06F17/27;G06F21/32
代理公司: 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 代理人: 譚磊
地址: 518129 廣東*** 國省代碼: 廣東;44
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 數(shù)據(jù) 預(yù)處理 方法 裝置 系統(tǒng)
【說明書】:

技術(shù)領(lǐng)域

發(fā)明實(shí)施例涉及通信技術(shù),尤其涉及一種數(shù)據(jù)預(yù)處理方法、裝置及系統(tǒng)。

背景技術(shù)

隨著信息技術(shù)的飛速發(fā)展,計(jì)算機(jī)和網(wǎng)絡(luò)已成為日常辦公、通訊交流和協(xié)作互動的必備工具和途徑,在提高各公司的工作效率的同時(shí)也會使信息系統(tǒng)中的內(nèi)部數(shù)據(jù)遭到泄露,讓公司受到知識產(chǎn)權(quán)、安全和隱私等多方面的威脅,因此,需要采用數(shù)據(jù)泄露防護(hù)(Data?Loss?Prevention,簡稱為DLP)技術(shù)來解決這一問題,而DLP技術(shù)的核心是數(shù)據(jù)內(nèi)容感知技術(shù),數(shù)據(jù)內(nèi)容感知技術(shù)包括數(shù)據(jù)預(yù)處理技術(shù)和指紋提取技術(shù)。

現(xiàn)有技術(shù)中,數(shù)據(jù)預(yù)處理過程為:將文本數(shù)據(jù)作為字節(jié)序列,采用定長步距的滑動窗口在字節(jié)序列上滑動,得到K-Gram集合;指紋提取過程為:將各K-Gram進(jìn)行歸一化處理,計(jì)算各K-Gram的哈希值,得到K-Gram哈希值集合,即候選指紋集合,若K-Gram在文本數(shù)據(jù)中出現(xiàn)的頻率高,則從候選指紋集合中選擇K-Gram對應(yīng)的K-Gram哈希值,得到K-Gram指紋,以進(jìn)行指紋匹配來判斷文本數(shù)據(jù)是否包括機(jī)密數(shù)據(jù)。

在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中的數(shù)據(jù)預(yù)處理過程將文本數(shù)據(jù)作為字節(jié)序列,忽略了自然語言的語法和語義信息,無法去除語義區(qū)分度不高的字符,從而使得提取出的指紋用于DLP技術(shù)時(shí),造成數(shù)據(jù)泄露檢測精度低。

發(fā)明內(nèi)容

本發(fā)明提供一種數(shù)據(jù)預(yù)處理方法、裝置及系統(tǒng),用于提高數(shù)據(jù)泄密檢測精度。

第一方面,本發(fā)明實(shí)施例提供一種數(shù)據(jù)預(yù)處理方法,包括:

根據(jù)預(yù)設(shè)錨字符集合中的錨字符將文本數(shù)據(jù)分割成至少一個數(shù)據(jù)單元,每個數(shù)據(jù)單元均不包括所述錨字符,且每個數(shù)據(jù)單元的字符個數(shù)不超過預(yù)設(shè)的單元字符上限值;

將所述至少一個數(shù)據(jù)單元組合成至少一個數(shù)據(jù)塊,每個數(shù)據(jù)塊包括至少一個數(shù)據(jù)單元且每個數(shù)據(jù)塊的字符個數(shù)不超過預(yù)設(shè)的塊字符閾值,以對所述至少一個數(shù)據(jù)塊進(jìn)行指紋提取處理。

結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)預(yù)設(shè)錨字符集合中的錨字符將文本數(shù)據(jù)分割成至少一個數(shù)據(jù)單元,包括:

確定當(dāng)前單元滑動窗口,所述當(dāng)前單元滑動窗口的起始點(diǎn)和終止點(diǎn)均指向所述文本數(shù)據(jù)中的同一個字符;

將所述終止點(diǎn)向所述文本數(shù)據(jù)中的后續(xù)字符滑動,直至所述當(dāng)前單元滑動窗口內(nèi)的字符個數(shù)等于所述單元字符上限值時(shí),或,所述當(dāng)前單元滑動窗口內(nèi)的字符個數(shù)小于所述單元字符上限值且所述終止點(diǎn)指向的字符為所述錨字符時(shí),或,所述當(dāng)前單元滑動窗口內(nèi)的字符個數(shù)小于所述單元字符上限值且所述終止點(diǎn)指向的字符為所述文本數(shù)據(jù)的最后一個字符時(shí),停止滑動;

根據(jù)所述當(dāng)前單元滑動窗口內(nèi)除錨字符之外的所有字符,得到一個數(shù)據(jù)單元。

結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第二種可能的實(shí)現(xiàn)方式中,所述根據(jù)當(dāng)前單元滑動窗口內(nèi)除錨字符之外的所有字符得到一個數(shù)據(jù)單元之后,還包括:

若所述當(dāng)前單元滑動窗口內(nèi)最后一個字符不是所述文本數(shù)據(jù)的最后一個字符,則將所述當(dāng)前單元滑動窗口的起始點(diǎn)和終止點(diǎn)均指向所述當(dāng)前單元滑動窗口內(nèi)最后一個字符在所述文本數(shù)據(jù)中的下一個字符。

結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式或第一方面的第二種可能的實(shí)現(xiàn)方式,在第一方面的第三種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述當(dāng)前單元滑動窗口內(nèi)除錨字符之外的所有字符,得到一個數(shù)據(jù)單元,包括:

若所述當(dāng)前單元滑動窗口內(nèi)除錨字符之外的字符個數(shù)不小于預(yù)設(shè)的單元字符下限值,則根據(jù)所述當(dāng)前單元滑動窗口內(nèi)除錨字符之外的所有字符,得到一個數(shù)據(jù)單元;

若所述當(dāng)前單元滑動窗口內(nèi)除錨字符之外的字符個數(shù)小于預(yù)設(shè)的單元字符下限值,則丟棄所述當(dāng)前單元滑動窗口內(nèi)的所有字符。

結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式或第一方面的第二種可能的實(shí)現(xiàn)方式或第一方面的第三種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,所述將所述至少一個數(shù)據(jù)單元組合成至少一個數(shù)據(jù)塊,包括:

將所述至少一個數(shù)據(jù)單元按在所述文本數(shù)據(jù)中的順序依次排列;

將當(dāng)前塊滑動窗口的左沿和右沿均指向所述至少一個數(shù)據(jù)單元中的第一個數(shù)據(jù)單元;

若當(dāng)前塊滑動窗口內(nèi)的字符個數(shù)小于所述塊字符閾值,則將所述右沿向后續(xù)數(shù)據(jù)單元滑動,直至所述當(dāng)前塊滑動窗口內(nèi)的字符個數(shù)大于所述塊字符閾值時(shí)將所述右沿前向滑動一個數(shù)據(jù)單元后停止滑動,或者,直至所述當(dāng)前塊滑動窗口內(nèi)的字符個數(shù)等于所述塊字符閾值時(shí)停止滑動;

根據(jù)所述當(dāng)前塊滑動窗口內(nèi)的至少一個數(shù)據(jù)單元,得到一個數(shù)據(jù)塊。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210567880.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久99精| 在线国产一区二区三区| 国产精品高潮呻吟88av| 久久久久亚洲最大xxxx| 国产又黄又硬又湿又黄| 夜夜爽av福利精品导航| 国产一卡在线| 国产精品视频tv| 久久精品亚洲精品国产欧美| 国产精品久久久av久久久| 午夜欧美a级理论片915影院| 国产三级欧美三级日产三级99| 狠狠综合久久av一区二区老牛| 午夜片在线| 自偷自拍亚洲| 国产精品精品视频一区二区三区| 国产区一二| 日本高清h色视频在线观看| 欧美高清视频一区二区三区| 欧美日韩一区二区三区在线播放 | 午夜伦理片在线观看| 国产一区亚洲一区| sb少妇高潮二区久久久久| 欧美一区二区久久| 欧美一区二区免费视频| 午夜社区在线观看| 欧美一区二区三区久久精品| 精品欧美一区二区精品久久小说| 日韩精品中文字幕一区二区三区| 国产免费一区二区三区四区五区 | 欧美精品二区三区| 日韩av在线网址| 国产婷婷一区二区三区久久| 韩国女主播一区二区| 日韩亚洲精品视频| 中文文精品字幕一区二区| 国产品久精国精产拍| 国产999在线观看| 中文丰满岳乱妇在线观看| 午夜影院啊啊啊| 亚洲欧美一二三| 一区二区国产精品| 波多野结衣女教师电影| 精品国产一二三四区| 91在线一区二区| 午夜三级大片| 久久精品视频3| 大bbw大bbw巨大bbw看看| 狠狠插影院| 国产女人与拘做受免费视频| 国产精品日韩电影| 国产乱对白刺激视频在线观看| 欧美资源一区| 鲁丝一区二区三区免费| 欧美日韩国产区| 欧美激情在线一区二区三区| 美女销魂免费一区二区| 国产999在线观看| 国产一区二区极品| 年轻bbwbbw高潮| 国产1区2区视频| 久久精品国产99| 午夜电影三级| 制服丝袜视频一区| 久久99精品久久久久婷婷暖91| 亚洲麻豆一区| 国产精品无码永久免费888| 欧美一区二区精品久久911 | 欧美精品xxxxx| 久久综合狠狠狠色97| freexxxx性| 久久精品手机视频| 中文字幕理伦片免费看| 日韩一级免费视频| 午夜剧场一区| 91亚洲欧美日韩精品久久奇米色| 国产精品视频一区二区三| 91社区国产高清| 最新av中文字幕| 国产精品美女久久久另类人妖| 国产91麻豆视频| 国产精品精品国内自产拍下载| 高清人人天天夜夜曰狠狠狠狠| 精品美女一区二区三区| 欧美一区二区三区激情在线视频 | 国产精品一区久久人人爽| 久久99亚洲精品久久99果| 亚洲欧美日韩综合在线| 久久精品99国产精品亚洲最刺激| 一本大道久久a久久精品| 日韩一区高清| 少妇高潮在线观看| 久久一二区| 久久99精品久久久久国产越南| 国产一区二区高潮| 国产99小视频| 国产91丝袜在线熟| 午夜伦理在线观看| 午夜诱惑影院| 色吊丝av中文字幕| 色综合久久精品| 天干天干天干夜夜爽av| 亚洲精品乱码久久久久久写真| 国产乱子一区二区| 国产一区2| 一区不卡av| 欧美精品免费一区二区| 国产aⅴ精品久久久久久| 91黄在线看| 97人人模人人爽人人喊38tv| 免费观看又色又爽又刺激的视频| 综合久久激情| 午夜激情在线播放| 国产三级在线视频一区二区三区| 国产乱淫精品一区二区三区毛片| 在线国产一区二区三区| 中文字幕一区三区| 国产韩国精品一区二区三区| 久久久一二区| 久久一区二| 国产91综合一区在线观看| 国产一区中文字幕在线观看| 国产一区二区三区小说| 国产欧美一区二区三区免费看| 国产清纯白嫩初高生在线播放性色| 中文字幕日韩一区二区| 色午夜影院| 久久久久一区二区三区四区| 欧美乱偷一区二区三区在线 | 456亚洲精品| 欧美日韩国产91| 国产91九色视频| 性生交大片免费看潘金莲| 欧美日韩偷拍一区| 国产乱色国产精品播放视频| 欧美一区二区三区三州| 激情aⅴ欧美一区二区三区| 久久91久久久久麻豆精品| 国产精品爽到爆呻吟高潮不挺| 国产一区二区三级| 中文字幕在线视频一区二区| 午夜看片网址| 国产一级片大全| 丰满少妇高潮惨叫久久久| 午夜精品影视| 欧美一区二区三区久久| 久久国产精品波多野结衣| 在线观看v国产乱人精品一区二区| 国产精品一区二区麻豆| 欧美福利三区| 日韩久久电影| 日本午夜无人区毛片私人影院| 国产精品女同一区二区免费站| 国产农村乱色xxxx| 性欧美精品动漫| 国产精品久久国产三级国电话系列 | 久久一二区| 欧美亚洲精品suv一区| 少妇精品久久久久www蜜月| 国语对白老女人一级hd| 激情久久久| 91精品国产影片一区二区三区| 91精品久久久久久久久久| 午夜一区二区三区在线观看| 日本精品一二区| 久久精品爱爱视频| 国产精品无码永久免费888| 午夜电影院理论片做爰| 免费视频拗女稀缺一区二区| 午夜剧场伦理| xxxx18日本护士高清hd| 久久不卡一区| 亚洲精品日本无v一区| 午夜欧美a级理论片915影院| 午夜肉伦伦| 国产一区二区在线精品| 久久久综合亚洲91久久98| 亚洲国产精品女主播| 国产精品视频久久| 国产精选一区二区| 午夜理伦影院| 久久99精| 免费**毛片| 视频一区二区中文字幕| 国产天堂第一区| 88国产精品视频一区二区三区 | 日本看片一区二区三区高清| 91麻豆精品国产91久久久资源速度| 精品国产区| 国产精品视频久久| 国产亚洲精品久久久久秋霞| 狠狠色噜噜狠狠狠四色米奇| 热99re久久免费视精品频软件| 欧美日韩激情在线| 激情久久久| 午夜精品影视| 狠狠色狠狠色综合系列| 久久不卡一区| 日韩av一区不卡| 久久久999精品视频| 国产精品1区二区| 一色桃子av大全在线播放| 亚洲欧美国产中文字幕 | 狠狠色依依成人婷婷九月| 亚洲精品丝袜| 美国三级日本三级久久99| 岛国黄色av| 亚洲精品久久久久一区二区| 国精产品一二四区在线看| 国产区二区| 91精品视频在线观看免费| 国产88av| 日本白嫩的18sex少妇hd| 亚洲女人av久久天堂| 456亚洲精品| 国产在线视频二区| 国产偷国产偷亚洲清高| 男女视频一区二区三区| 国产三级在线视频一区二区三区| 国产片91| 久久久综合亚洲91久久98| 国产一级自拍片| 国产一级片大全| 国产一区二区三区四| 最新国产精品久久精品| 国产精品天堂| 国产乱人伦精品一区二区| a级片一区| 欧美高清极品videossex| 日韩精品免费一区二区三区| 亚洲精品国产综合| 性欧美精品动漫| 国产精品视频一二区| 夜夜嗨av色一区二区不卡| 亚洲精品国产suv| 国产99久久九九精品免费| 浪潮av网站| 中文字幕一区二区三区又粗| 97午夜视频| 毛片大全免费观看| 国产伦高清一区二区三区| 国产一区二区视频免费观看| 国产资源一区二区| 免费看性生活片| 国产午夜一区二区三区| 亚洲精品久久久久久久久久久久久久 |