[發(fā)明專利]一種涉黃網(wǎng)站主動舉報(bào)系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810333657.8 | 申請日: | 2018-04-13 |
| 公開(公告)號: | CN108536843A | 公開(公告)日: | 2018-09-14 |
| 發(fā)明(設(shè)計(jì))人: | 鄭俊杰 | 申請(專利權(quán))人: | 鄭俊杰 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 528051 廣東省佛山市禪城區(qū)張槎*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)站 抓取 內(nèi)容識別模塊 檢索效率 爬蟲裝置 服務(wù)器 搜索 主流 | ||
本發(fā)明提供一種涉黃網(wǎng)站主動舉報(bào)系統(tǒng),包括網(wǎng)站爬蟲裝置、存諸模塊、內(nèi)容識別模塊、服務(wù)器。本發(fā)明的有益效果是,通過本系統(tǒng),不僅可以從海量的信息中有針對性地主動抓取的相關(guān)違禁信息,而且還可以利用主流的搜索網(wǎng)站獲得找到違禁信息進(jìn)行處理,增加了檢索效率。
技術(shù)領(lǐng)域
本發(fā)明主要涉及信息技術(shù)領(lǐng)域,尤其是一種涉黃網(wǎng)站主動舉報(bào)系統(tǒng)。
背景技術(shù)
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,內(nèi)容網(wǎng)站已廣泛地應(yīng)用于如公共信息業(yè)、廣告、教育、醫(yī)學(xué)、商業(yè)及娛樂等多個領(lǐng)域。數(shù)據(jù)信息的傳播也變得越來越容易,數(shù)字電視、文學(xué)、圖片、音樂等信息獲得迅速的傳播,而人們接觸網(wǎng)絡(luò)的年齡超來超早,容易受到網(wǎng)絡(luò)傳播的違禁信息所影響。
當(dāng)今,人們面臨著涉黃、涉暴等信息的危害,特別是對自制能力不強(qiáng)的青少年,而是面對浩如煙海的視頻信息,如何快速、有效地找到帶有涉黃、涉暴等危害信息的內(nèi)容,已經(jīng)成為了迫切的需求。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明提供一種涉黃網(wǎng)站主動舉報(bào)系統(tǒng),包括網(wǎng)站爬蟲裝置、存諸模塊、內(nèi)容識別模塊、服務(wù)器;其中:
所述的網(wǎng)站爬蟲裝置用于自動從互聯(lián)網(wǎng)上抓取網(wǎng)站文字內(nèi)容、圖片內(nèi)容、視頻內(nèi)容,將其存儲到所述存儲模塊中;
所述的內(nèi)容識別模塊用于識別審核所抓取的文字內(nèi)容、圖片內(nèi)容、視頻內(nèi)容是否涉黃并返饋結(jié)果到服務(wù)器;
所述的服務(wù)器用于管理審核從互聯(lián)網(wǎng)上抓取網(wǎng)站文字內(nèi)容、圖片內(nèi)容、視頻內(nèi)容信息并對網(wǎng)站爬蟲裝置的抓取規(guī)則進(jìn)行更新維護(hù)。
其中,所述的所述的網(wǎng)站爬蟲裝置抓取帶文字信息的超鏈接并即時通過所述的文字內(nèi)容識別模塊進(jìn)行識別,如符合抓取規(guī)則則進(jìn)一步抓取其子鏈接內(nèi)容。
其中,所述的服務(wù)器包括抓取規(guī)則管理模塊、涉黃內(nèi)容特征管理模塊,其中所述的抓取規(guī)則管理模塊可以使所述的網(wǎng)站爬蟲裝置針對性關(guān)鍵詞通過百度搜索抓取搜索結(jié)果的子鏈接內(nèi)容;所述的涉黃內(nèi)容特征管理模塊負(fù)責(zé)對涉黃內(nèi)容特征進(jìn)行更新維護(hù)。
綜上所述,與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是,通過本系統(tǒng),不僅可以從海量的信息中有針對性地主動抓取的相關(guān)違禁信息,而且還可以利用主流的搜索網(wǎng)站獲得找到違禁信息進(jìn)行處理,增加了檢索效率。
具體實(shí)施方式
下文中將結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。應(yīng)當(dāng)理解的是,此處所描述的具體實(shí)施方式僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
在本實(shí)施例中提供了為解決上述問題,本發(fā)明提供一種涉黃網(wǎng)站主動舉報(bào)系統(tǒng),包括網(wǎng)站爬蟲裝置、存諸模塊、內(nèi)容識別模塊、服務(wù)器;其中:
所述的網(wǎng)站爬蟲裝置用于自動從互聯(lián)網(wǎng)上抓取網(wǎng)站文字內(nèi)容、圖片內(nèi)容、視頻內(nèi)容,將其存儲到所述存儲模塊中;
所述的內(nèi)容識別模塊用于識別審核所抓取的文字內(nèi)容、圖片內(nèi)容、視頻內(nèi)容是否涉黃并返饋結(jié)果到服務(wù)器;
所述的服務(wù)器用于管理審核從互聯(lián)網(wǎng)上抓取網(wǎng)站文字內(nèi)容、圖片內(nèi)容、視頻內(nèi)容信息并對網(wǎng)站爬蟲裝置的抓取規(guī)則進(jìn)行更新維護(hù)。
具體地,所述的所述的網(wǎng)站爬蟲裝置抓取帶文字信息的超鏈接并即時通過所述的文字內(nèi)容識別模塊進(jìn)行識別,如符合抓取規(guī)則則進(jìn)一步抓取其子鏈接內(nèi)容。
具體地,所述的服務(wù)器包括抓取規(guī)則管理模塊、涉黃內(nèi)容特征管理模塊,其中所述的抓取規(guī)則管理模塊可以使所述的網(wǎng)站爬蟲裝置針對性關(guān)鍵詞通過百度搜索抓取搜索結(jié)果的子鏈接內(nèi)容;所述的涉黃內(nèi)容特征管理模塊負(fù)責(zé)對涉黃內(nèi)容特征進(jìn)行更新維護(hù)。
綜上所述,與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是,通過本系統(tǒng),不僅可以從海量的信息中有針對性地主動抓取的相關(guān)違禁信息,而且還可以利用主流的搜索網(wǎng)站獲得找到違禁信息進(jìn)行處理,增加了檢索效率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭俊杰,未經(jīng)鄭俊杰許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810333657.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 與HTTP網(wǎng)站關(guān)聯(lián)的WAP網(wǎng)站
- 基于網(wǎng)站指紋推送白名單的方法及系統(tǒng)
- 網(wǎng)站漏洞檢測方法和系統(tǒng)
- 一種網(wǎng)站建立方法、裝置及計(jì)算設(shè)備
- 一種網(wǎng)站識別方法及裝置
- 網(wǎng)站風(fēng)險(xiǎn)評估方法及裝置
- 網(wǎng)站版權(quán)時間的管理方法、裝置、存儲介質(zhì)及設(shè)備
- 一種網(wǎng)站開發(fā)系統(tǒng)及方法
- 一種基于網(wǎng)站地圖的指紋識別方法
- 網(wǎng)站應(yīng)用框架指紋識別的方法、設(shè)備、裝置及介質(zhì)





