日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于多分類器融合的敏感網頁過濾方法及系統有效

專利信息
申請號: 200710065181.6 申請日: 2007-04-05
公開(公告)號: CN101281521A 公開(公告)日: 2008-10-08
發明(設計)人: 胡衛明;陳周耀;吳偶;朱明亮 申請(專利權)人: 中國科學院自動化研究所
主分類號: G06F17/30 分類號: G06F17/30;G06K9/62;H04L12/26
代理公司: 中科專利商標代理有限責任公司 代理人: 周國城
地址: 100080北*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 分類 融合 敏感 網頁 過濾 方法 系統
【說明書】:

技術領域

發明涉及信息過濾技術領域,尤指識別含有敏感信息的網頁的方法。

背景技術

由于互聯網敏感信息對于互聯網用戶尤其是青少年造成了極大的危害,因此引起了研究者和業界的廣泛關注。

目前有很多種敏感信息過濾方法,包括黑白名單,IP過濾以及關鍵詞匹配等等過濾手段。總的來說,一方面,這些過濾技術采用一種非常機械的方式,能夠對一些敏感網頁達到100%的過濾效率,響應時間也非常短,但是過濾參數更新的周期只能跟隨著實際敏感網頁的出現而變化,不能夠應對實際敏感網站的快速變化。另一方面,由于網頁的內容信息基本上沒有利用或者很少利用,因此造成了很高的誤過濾率,影響了用戶的正常上網。

基于內容的敏感信息智能識別技術是近年來過濾技術的一個發展方向。目前已有多種基于內容的敏感信息識別方法。

目前的敏感網頁識別方法一般主要建立敏感文本識別基礎之上。因此核心是對文本的處理,首先提取網頁中的文本,然后提取特征,然后利用機器學習里面的分類算法來對特征進行訓練和分類。其中特征提取的方法通常采用的是:(1)人工給定一個關鍵詞列表;(2)利用文本匹配的方法來統計各關鍵詞出現的次數;(3)各關鍵詞出現的次數組成一個向量,經過歸一化等處理后,該向量作為該文本的特征向量。一般給定的關鍵詞數目小于100。然后選取分類器來進行訓練和預測。新加坡Pui?Y.Lee等人利用Kohonen自組織神經網絡作為分類器,取得了較好的實際效果。還存在一些敏感圖像識別方法,中國科學院自動化所楊金鋒等人提出了一種基于內容的敏感圖像識別方法,在CAMPAQ數據庫上取得了超過80%的識別率。

同機械的過濾方法類似,以上方法沒有很好的利用web特征,目前還不能夠達到滿意的效果,例如基于文本的敏感網頁識別不能夠對與敏感主題相關的正常網頁進行很好的識別,基于圖像的敏感網頁識別的誤識別率很高。已存在的融合算法也僅僅是通過與或操作來融合,不能夠根本上提高識別率。

發明內容

現有技術基于文本的敏感網頁識別不能夠對與敏感主題相關的正常網頁進行很好的識別,基于圖像的敏感網頁識別的誤識別率高,采用的融合算法是通過與或操作來融合,不能夠根本上提高識別率,為了解決現有技術的這些問題,本發明的目的是從web網頁特點出發,提供一種基于多分類器融合的敏感網頁過濾方法及系統。

為了實現所述的目的,本發明的一方面,提供基于多分類器融合的敏感網頁過濾方法,包括如下步驟:

步驟S1:獲取目標網頁統一資源定位符的源代碼,進行預處理,用于獲取中文文本信息,獲取網頁中有效圖像集合信息;

步驟S2:基于預處理提供信息,利用決策樹學習中的C4.5算法將輸入網頁中文文本和有效圖像生成文本、圖像及文本與圖像的混合網頁樣式,用于獲得文本流、圖像流和文本與圖像混合流信息;

步驟S3:利用多分類器識別與網頁樣式的指定分配關系,獲得目標網頁;

步驟S4:根據識別結果綜合判斷目標網頁是否敏感,如果敏感,則執行步驟5,如果不敏感,則執行步驟6;

步驟S5:將識別的敏感網頁送入Web瀏覽器,并在瀏覽器中警示用戶所瀏覽網頁含有敏感內容,瀏覽被禁止;

步驟S6:在Web瀏覽器中正常顯示原網頁。

所述分類器識別包括:利用連續敏感文本分類器對以文本為主的網頁樣式進行識別、利用敏感圖像分類器器對以圖像為主的網頁樣式中的圖像集合進行識別和對混合型網頁樣式則利用離散敏感文本分類器和敏感圖像分類器融合進行識別。

所述獲取網頁中有效圖像步驟包括:

步驟11:在預處理階段通過解析網頁超文本標示語言代碼,獲取該網頁所包含每幅圖像的尺寸和位置信息,用于識別目標網頁的整體內容;

步驟12:如果尺寸信息和位置信息符合事先統計好的規則,則將該圖像劃分至有效圖像集合中。

所述決策樹C4.5算法將輸入網頁生成網頁樣式的步驟包括:

步驟21:計算屬性集中網頁統一資源定位符、網頁中文本長度和網頁中圖像基于像素量的分級,得到信息熵和分類前后信息熵的增益變化;

步驟22:將信息熵增益作為分類尺度,給出分類依據,即取最大的信息熵增益的屬性集劃分為最終決策;

步驟23:重復步驟22直到所有屬性集都被劃分,從而形成決策樹和分類規則。

所述利用連續敏感文本分類器對以文字為主的網頁進行識別步驟包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200710065181.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 香港三日本8a三级少妇三级99| 国产精品一二三区视频网站| 99精品区| 日韩中文字幕在线一区二区| 色吊丝av中文字幕| 欧美日韩精品中文字幕| 黄色国产一区二区| 国产乱了高清露脸对白| 狠狠色狠狠色很很综合很久久| 国产精品国精产品一二三区| 欧美精品在线视频观看| 国产在线拍偷自揄拍视频| 国产乱人乱精一区二视频国产精品| 7777久久久国产精品| 欧美一区二区三区黄| 国产在线精品一区二区在线播放| 国产日韩欧美三级| 国产1区2区3区| 97久久精品一区二区三区观看| 国产精品乱战久久久| 91福利试看| 国产欧美日韩va另类在线播放| 国产欧美一区二区精品性色超碰| 国产精品不卡在线| 精品国产乱码久久久久久图片| 99色精品视频| 99久久精品一区字幕狠狠婷婷 | 精品国产一级| 亚洲久色影视| 大bbw大bbw巨大bbb| 夜色av网站| 国产真裸无庶纶乱视频| 日韩精品一二区| 免费xxxx18美国| 中文字幕在线乱码不卡二区区| 国产精品国产三级国产播12软件 | 97国产精品久久久| 午夜伦理片在线观看| 欧美激情在线免费| www亚洲精品| 精品久久9999| 欧美在线视频一区二区三区| 色就是色欧美亚洲| 四虎影视亚洲精品国产原创优播| 日韩久久精品一区二区三区| 国产999久久久| 免费精品99久久国产综合精品应用| 淫片免费看| 99er热精品视频国产| 岛国黄色av| 午夜看大片| 国产一区观看| 一区二区三区精品国产| 中文字幕一区二区三区免费视频| 久久久久久综合网| 午夜av片| 亚洲国产美女精品久久久久∴| 97久久国产精品| 国产精品自拍在线观看| 久久久久久久久久国产精品| 狠狠色噜噜狠狠狠狠777| 国产一区2| 午夜av片| 日本一区二区电影在线观看| 精品国产一区在线| 国产精品一二三区视频出来一| xxxxx色| 精品国产免费久久| 久久国产精品久久久久久电车| 日韩午夜电影院| 热99re久久免费视精品频软件| 国产欧美日韩中文字幕| 欧美精品一区久久| 欧美激情在线免费| 久久99精品国产麻豆婷婷| 99re久久精品国产| 欧美一级不卡| 久久精品国产久精国产| 窝窝午夜精品一区二区| 99久久国产综合精品尤物酒店| 国产午夜亚洲精品午夜鲁丝片| 国产极品一区二区三区| 久久中文一区| 日韩中文字幕一区二区在线视频| 午夜av免费观看| 国产1区2区3区| 色婷婷综合久久久中文一区二区| 午夜影院激情| 性欧美激情日韩精品七区| 国产一区观看| 亚洲国产精品一区二区久久hs| 一区精品二区国产| 二区三区视频| 国产精品乱码一区二区三区四川人 | 精品videossexfreeohdbbw| 国产aⅴ一区二区| 亚洲国产精品97久久无色| 欧美性受xxxx狂喷水| 久久精品国产精品亚洲红杏| 国产精品1区二区| 一区二区欧美在线| 日本三级香港三级| 激情欧美一区二区三区| 日韩一区国产| 国产精品1区二区| 日韩午夜三级| 午夜一区二区视频| 夜夜精品视频一区二区| 久久99久国产精品黄毛片入口 | 在线国产一区二区三区| 日本不卡精品| 欧美日韩一区电影| 亚洲1区在线观看| 狠狠综合久久av一区二区老牛| 91精品国产91热久久久做人人| 国产精品白浆一区二区| 玖玖玖国产精品| 国产精品一级片在线观看| 久久久精品免费看| 91精品第一页| 性色av色香蕉一区二区| 日韩av在线高清| 亚洲二区在线播放视频| 伊人久久婷婷色综合98网| 日韩中文字幕在线一区二区| 久久夜色精品久久噜噜亚| 亚洲精品久久久久玩吗| 91av精品| 日本一二三区视频在线| 午夜激情看片| 欧美视屏一区| 妖精视频一区二区三区| 欧美xxxxhdvideos| 亚洲国产99| 日韩国产精品久久久久久亚洲| 中文字幕一区2区3区| 久久er精品视频| 国产视频二区| 国内精品99| 亚洲国产精品区| 日韩中文字幕久久久97都市激情| 久久精品国产99| 中文在线一区二区三区| 国产麻豆精品一区二区| 99久久国产综合精品色伊| 激情久久影院| 国产91色综合| 欧美日韩一区二区三区在线观看视频| 亚洲乱码一区二区| 国产在线精品一区二区| 国产一区在线视频观看| 狠狠色综合久久婷婷色天使| 亚洲精品国产一区二区三区| 在线国产一区二区| 久久精品com| 视频二区一区国产精品天天| 国产日韩欧美另类| 国产一区二区三区在线电影| 国产欧美亚洲精品| 精品一区二区三区视频?| 欧美二区精品| 国产一级二级在线| 欧美精品五区| 国产一区二区91| 国产精品一区二区免费视频| 欧美一级不卡| 96国产精品| 国产一级二级在线| 国产精品一区二区人人爽| 亚洲第一天堂无码专区| 亚洲欧美一区二区三区1000| 99国产精品免费| 国产偷久久一区精品69| 日本一二三区视频| 日韩免费一级视频| 91狠狠操| 欧美777精品久久久久网| 娇妻被又大又粗又长又硬好爽| 亚洲精品国产91| 91麻豆精品国产91久久久久推荐资源| 欧美久久久一区二区三区| 伊人久久婷婷色综合98网| 国产欧美一区二区三区沐欲| 精品一区二区在线视频| 久久久久久中文字幕| 午夜激情免费电影| 国产精品二区一区| 欧美日韩国产在线一区| 欧美极品少妇xxxxⅹ| 91精品久久久久久综合五月天| 欧美激情国产一区| 欧美高清性xxxx| 国产一区三区四区| 亚洲一卡二卡在线| 欧美一区二区三区免费观看视频| 久久影院一区二区| 国产91在| 久久99精品国产99久久6男男| 视频一区二区中文字幕| 少妇又紧又色又爽又刺激视频网站| 国产91在线播放| 午夜电影网一区| 99精品区| 夜夜嗨av禁果av粉嫩av懂色av| 国产一级不卡视频| 中文在线√天堂| 国产麻豆一区二区三区精品| 国产一区二区视频播放| 一区二区国产盗摄色噜噜| 国产专区一区二区| 欧美视屏一区| 久久激情图片| 李采潭无删减版大尺度| 香港三日本三级三级三级| 久99久精品| 久久噜噜少妇网站| 日韩av免费电影| 国产欧美一区二区三区视频| 久久夜色精品国产噜噜麻豆| 日日夜夜亚洲精品| 亚洲精品一区在线| 中文字幕av一区二区三区四区| 性old老妇做受| 欧美日韩一级二级三级| 国产美女一区二区三区在线观看| 国产一区日韩在线| 久久国产精品首页| 欧美一区二区三区在线视频播放| 国产精品乱综合在线| 亚洲高清乱码午夜电影网| 夜夜夜夜夜猛噜噜噜噜噜gg| 国产第一区在线观看| 久久久中精品2020中文| 国内久久久久久| 国产激情二区| 日韩av在线网址| 国产美女三级无套内谢| 一区二区在线视频免费观看| 亚洲欧美一区二| 久久精品欧美一区二区| 久久两性视频| 国产精品一区二区不卡| 91免费视频国产| 夜夜躁人人爽天天天天大学生| 国产精品久久久久久久妇女| 国产欧美日韩另类|