[發明專利]基于云計算的移動終端不良信息過濾方法及系統有效
| 申請號: | 201810071433.4 | 申請日: | 2018-01-25 |
| 公開(公告)號: | CN108319672B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 孫知信;邢府緯;駱冰清 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06V10/764 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 姚姣陽 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 計算 移動 終端 不良信息 過濾 方法 系統 | ||
基于云計算的移動終端不良信息過濾方法及系統,方法包括如下步驟:S1、客戶端根據自定義過濾規則和網站在線檢測過濾待檢測的網頁,再將本地的過濾規則和待檢測的網頁發送至云端;S2、待檢測的網頁按照預先設定的URL過濾和關鍵字過濾進行初步過濾;S3、對初步過濾后的網頁進行預處理,并輸入至云計算的分類器;S4、分類器通過并行架構計算出待檢測的網頁上信息之間的關聯關系,并對信息進行初步分類,再根據預設好的閾值判斷是否為不良網站;S5、經過初步分類的信息通過決策樹算法進行二次分類,識別待檢測的網頁的類型。本發明將傳統的客戶端過濾方式與云端智能分類過濾方式相結合,構建一種新型混合過濾方法,有效提升了檢測過濾的效率和正確率。
技術領域
本發明屬于信息過濾技術領域,具體涉及一種基于云計算的移動終端不良信息過濾方法及系統。
背景技術
隨著我國經濟以及信息技術的不斷發展,互聯網已經融入到人們的生活當中,越來越多的人選擇從互聯網中選取所需要的信息,這也極大的促進了互聯網的蓬勃發展。同時,人們不在僅僅依靠個人計算機來獲取網絡上的信息,以智能手機為代表的移動設備以其攜帶方便、使用快捷等優點成為了人們隨時隨地連接互聯網的優先選擇。
目前國內的網絡過濾主流產品研發都聚焦在PC端,大多是通過簡單的黑白名單對比過濾不良網站。剩余的也只是簡單的通過設置黑白名單以及敏感詞等較為初級的方式進行屏蔽,這類方法不僅顯的較為生硬需要人為的設置,同時也會存在過濾正常網頁的情況,而這類產品大多都是在客戶端本地進行過濾的,無法對網頁信息進行智能化過濾。
發明內容
本發明的目的在于:提供基于云計算的移動終端不良信息過濾方法及系統,將傳統的客戶端本地過濾方式與云端智能分類過濾方式相結合,構建一種新型混合過濾方法,有效提升了檢測過濾的效率和正確率。
為了達到以上目的,基于云計算的移動終端不良信息過濾方法,包括如下步驟:
S1、客戶端根據自定義過濾規則和網站在線檢測過濾待檢測的網頁,再將本地的過濾規則和待檢測的網頁發送至云端;
S2、待檢測的網頁按照預先設定的URL過濾和關鍵字過濾進行初步過濾;
S3、對初步過濾后的網頁進行預處理,并輸入至云計算的分類器;
S4、分類器通過并行架構計算出待檢測的網頁上信息之間的關聯關系,并對信息進行初步分類,再根據預設好的閾值判斷是否為不良網站;
S5、經過初步分類的信息通過決策樹算法進行二次分類,識別待檢測的網頁的網頁類型。
本發明的優選方案是:自定義過濾規則是手動設置黑白名單或所需屏蔽的關鍵字,網站在線檢測是通過識別待檢測的網站的URL和文本內容進行過濾。
優選地,客戶端通過網絡內容檢測請求控制模塊向云端發起請求,將本地的自定義過濾規則傳輸到云端更新,再向云端傳輸待檢測的網頁信息。
優選地,URL過濾為在云端設置已知不良網站的黑名單和已認證網站的白名單,在黑名單和白名單中查找是否包含待檢測的網頁網站,關鍵字過濾為將待檢測的網頁中的文本內容與預先設置的關鍵字實時對比,當匹配數量達到設定閾值后進行過濾。
優選地,步驟S3中對初步過濾后的網頁進行預處理包括文本預處理和圖像預處理,文本預處理為使用Libpcap函數包抓取網頁的文本內容,去除HTML標簽及CSS樣式,再采用統計模型中文分詞,過濾分詞出的無幫助詞匯;圖像預處理為對待測圖形去噪、分割以及邊緣分割,再通過YCbCr色彩模型對分割后的圖形進行二值化,提取膚色像素,獲取膚色像素的比例以及圖片的紋理特征,并通過人臉識別估算人臉的輪廓面積。
優選地,步驟S4中分類器為并行KNN分類過濾器,初步分類包括網頁信息分析階段和網頁信息分類階段。
更優選地,網頁信息分析階段的具體步驟為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810071433.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文件管理方法及移動終端
- 下一篇:一種基于關系數據庫的故障樹構建方法





