[發明專利]一種帶有初次篩選功能的數據過濾挖掘方法在審
| 申請號: | 201910160208.2 | 申請日: | 2019-03-04 |
| 公開(公告)號: | CN109902243A | 公開(公告)日: | 2019-06-18 |
| 發明(設計)人: | 倪向東;柯金霞 | 申請(專利權)人: | 廣州博士信息技術研究院有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/957;G06F16/332 |
| 代理公司: | 廣州市紅荔專利代理有限公司 44214 | 代理人: | 吳偉文 |
| 地址: | 510000 廣東省廣州市廣州高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征碼 用戶訪問 字詞數據庫 網頁數據 敏感 敏感數據 數據過濾 過濾 判定 數據安全技術 用戶訪問網頁 篩選 綠色上網 色情網站 上網行為 實時監控 數據特征 挖掘 閾值時 打碼 | ||
本發明公開了一種帶有初次篩選功能的數據過濾挖掘方法,涉及數據安全技術領域,其包括以下步驟:先建立敏感字詞數據庫特征碼;然后計算出該用戶訪問網頁時的數據特征碼;然后將用戶訪問的網頁數據特征碼與敏感字詞數據庫特征碼進行對比,然后當步驟三中獲取與所述敏感字詞數據庫特征碼相同的所述用戶訪問的網頁數據特征碼的數量達到設定的閾值時,可以判定所述用戶訪問的數據為敏感數據;最后當判定所述用戶訪問的網頁數據特征碼是敏感數據時,則將所述用戶訪問的網頁數據特征碼內的敏感字詞進行過濾并打碼。本發明通過建立敏感字詞數據庫特征碼,并對用戶的上網行為進行實時監控,解決了色情網站無法過濾的缺陷,達到綠色上網的目的。
技術領域
本發明涉及數據安全技術領域,具體為一種帶有初次篩選功能的數據過濾挖掘方法。
背景技術
國際標準化組織(ISO)對計算機系統安全的定義是:為數據處理系統建立和采用的技術和管理的安全保護,保護計算機硬件、軟件和數據不因偶然和惡意的原因遭到破壞、更改和泄露。由此計算機網絡的安全可以理解為:通過采用各種技術和管理措施,使網絡系統正常運行,從而確保網絡數據的可用性、完整性和保密性。所以,建立網絡安全保護措施的目的是確保經過網絡傳輸和交換的數據不會發生增加、修改、丟失和泄露等。
隨著計算機的普及,人們做到了足不出戶了知天下事,這體現了網絡帶給我的便利性,但是,網絡是把雙刃劍,有利也有弊,網絡造就了許多的成功人士,同樣也毀害了許多人,特別是青少年,在瀏覽網絡時難免因為好奇心瀏覽一些色情網站,從而一發不可收拾,沉迷在色情網絡內,為了營造一個良好的網絡環境,現如今急需一種帶有初次篩選功能的數據過濾挖掘方法。
發明內容
針對現有技術的不足,本發明提供了一種帶有初次篩選功能的數據過濾挖掘方法,以解決色情網站無法過濾的缺陷。
為達到以上目的,本發明采取的技術方案是:一種帶有初次篩選功能的數據過濾挖掘方法,包括以下步驟:
步驟一:從字詞數據庫中計算敏感字詞數據庫特征碼,并建立敏感字詞數據庫特征碼;
步驟二:監控用戶訪問網頁的行為,當監控到用戶訪問網頁時的行為后,按照步驟一所述的計算用戶訪問網頁數據的特征碼的方法,計算出該用戶訪問網頁時的數據特征碼;
步驟三:將用戶訪問的網頁數據特征碼與敏感字詞數據庫特征碼進行對比,并獲取用戶訪問網頁數據特征碼與敏感字詞數據庫特征碼相同的特征碼的數量,并將與敏感字詞相同的數據特征碼進行存儲;
步驟四:當步驟三中獲取與所述敏感字詞數據庫特征碼相同的所述用戶訪問的網頁數據特征碼的數量達到設定的閾值時,可以判定所述用戶訪問的數據為敏感數據;當與所述敏感字詞數據庫特征碼相同的所述用戶訪問的網頁數據特征碼的數量未達到系統設定的閾值時,重復步驟二到四,直到用戶訪問網頁的行為結束為止;
步驟五:當判定所述用戶訪問的網頁數據特征碼是敏感數據時,則將所述用戶訪問的網頁數據特征碼內的敏感字詞進行過濾并打碼。
優選的,所述步驟五將敏感字詞進行打碼過濾的同時還提醒用戶關閉網頁,若10s之內不關閉的話,系統將自動強制關閉網頁。
優選的,所述提醒用戶關閉網頁的信息為警告詞匯,并采用提示框的方式。
優選的,所述步驟五打碼的形式為***。
優選的,所述步驟五中強制關閉網頁次數達到三次以上后,系統將自動鎖閉網頁,并以郵件的方式再次警告訪問用戶,且郵件內有綠色上網學習問答的網址。
優選的,所述用戶若想再次解開網頁,則需要點擊綠色上網學習問答的網址學習并進行答題,若答題成功,則解除網頁的鎖定。
優選的,所述步驟一中所述敏感字詞數據庫據特征碼,具體為計算敏感字詞數據庫的MD5值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州博士信息技術研究院有限公司,未經廣州博士信息技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910160208.2/2.html,轉載請聲明來源鉆瓜專利網。





