[發(fā)明專利]信息過濾方法和裝置有效
| 申請?zhí)枺?/td> | 201611154627.8 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN108228609B | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計)人: | 馬慶麗 | 申請(專利權(quán))人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/957 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 韓建偉;張永明 |
| 地址: | 100083 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息 過濾 方法 裝置 | ||
1.一種信息過濾方法,其特征在于,包括:
獲取待展示的網(wǎng)絡(luò)平臺頁面中的內(nèi)容;
利用預(yù)先獲取的特征,對所述網(wǎng)絡(luò)平臺頁面中的內(nèi)容進(jìn)行過濾,得到所述網(wǎng)絡(luò)平臺頁面的主體內(nèi)容,其中,所述特征用于表示所述網(wǎng)絡(luò)平臺頁面中轉(zhuǎn)換信息的特征,所述轉(zhuǎn)換信息用于標(biāo)識由主體內(nèi)容轉(zhuǎn)換為非主體內(nèi)容;
展示過濾得到的所述主體內(nèi)容;
其中,利用預(yù)先獲取的特征,對所述網(wǎng)絡(luò)平臺頁面中的內(nèi)容進(jìn)行過濾,得到所述網(wǎng)絡(luò)平臺頁面的主體內(nèi)容包括:
對所述網(wǎng)絡(luò)平臺頁面進(jìn)行深度優(yōu)先搜索;
在搜索到所述特征的情況下,獲取從搜索的起始點(diǎn)到搜索到所述特征的特征點(diǎn)之間的內(nèi)容確定為所述網(wǎng)絡(luò)平臺頁面的主體內(nèi)容,過濾掉所述特征點(diǎn)之后的內(nèi)容,
其中,所述轉(zhuǎn)換信息包括所述主體內(nèi)容的結(jié)束信息,或所述非主體內(nèi)容的開始信息;
其中,對所述網(wǎng)絡(luò)平臺頁面進(jìn)行深度優(yōu)先搜索包括:
解析所述網(wǎng)絡(luò)平臺頁面,得到所述網(wǎng)絡(luò)平臺頁面的頁面結(jié)點(diǎn)樹,其中,所述頁面節(jié)點(diǎn)樹是根據(jù)深度優(yōu)先搜索進(jìn)行網(wǎng)絡(luò)平臺頁面分析時確定的樹結(jié)構(gòu)文本;
從所述頁面結(jié)點(diǎn)樹的根節(jié)點(diǎn)開始,對所述頁面結(jié)點(diǎn)樹中的各個結(jié)點(diǎn)進(jìn)行深度優(yōu)先搜索。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述起始點(diǎn)為所述頁面節(jié)點(diǎn)樹的根結(jié)點(diǎn),其中,獲取從搜索的起始點(diǎn)到搜索到所述特征的特征點(diǎn)之間的內(nèi)容確定為所述網(wǎng)絡(luò)平臺頁面的主體內(nèi)容,過濾掉所述特征點(diǎn)之后的內(nèi)容包括:
在執(zhí)行所述深度優(yōu)先搜索的過程中,若未搜索到所述特征,則將搜索過的結(jié)點(diǎn)對應(yīng)的內(nèi)容追加入主體內(nèi)容中;
若搜索到所述特征,記錄搜索到所述特征的特征點(diǎn),停止追加所述主體內(nèi)容,并將所述頁面結(jié)點(diǎn)樹中未搜索過的結(jié)點(diǎn)對應(yīng)的內(nèi)容過濾掉。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對所述網(wǎng)絡(luò)平臺頁面中的內(nèi)容進(jìn)行過濾之前,所述方法還包括:
獲取多個網(wǎng)絡(luò)平臺頁面;
從所述多個網(wǎng)絡(luò)平臺頁面中提取轉(zhuǎn)換信息,其中,所述轉(zhuǎn)換信息用于標(biāo)識由主體內(nèi)容轉(zhuǎn)換為非主體內(nèi)容;
基于提取到的轉(zhuǎn)換信息,生成所述特征。
4.一種信息過濾裝置,其特征在于,包括:
獲取單元,用于獲取待展示的網(wǎng)絡(luò)平臺頁面中的內(nèi)容;
過濾單元,用于利用預(yù)先獲取的特征,對所述網(wǎng)絡(luò)平臺頁面中的內(nèi)容進(jìn)行過濾,得到所述網(wǎng)絡(luò)平臺頁面的主體內(nèi)容,其中,所述特征用于表示所述網(wǎng)絡(luò)平臺頁面中轉(zhuǎn)換信息的特征,所述轉(zhuǎn)換信息用于標(biāo)識由主體內(nèi)容轉(zhuǎn)換為非主體內(nèi)容;
展示單元,用于展示過濾得到的所述主體內(nèi)容;
其中,過濾單元包括:
搜索模塊,用于對所述網(wǎng)絡(luò)平臺頁面進(jìn)行深度優(yōu)先搜索;
確定模塊,用于在搜索到所述特征的情況下,獲取從搜索的起始點(diǎn)到搜索到所述特征的特征點(diǎn)之間的內(nèi)容確定為所述網(wǎng)絡(luò)平臺頁面的主體內(nèi)容,過濾掉所述特征點(diǎn)之后的內(nèi)容,
其中,所述轉(zhuǎn)換信息包括所述主體內(nèi)容的結(jié)束信息,或所述非主體內(nèi)容的開始信息;
其中,所述搜索模塊包括:
解析模塊,用于解析所述網(wǎng)絡(luò)平臺頁面,得到所述網(wǎng)絡(luò)平臺頁面的頁面結(jié)點(diǎn)樹,其中,所述頁面節(jié)點(diǎn)樹是根據(jù)深度優(yōu)先搜索進(jìn)行網(wǎng)絡(luò)平臺頁面分析時確定的樹結(jié)構(gòu)文本;
第一搜索子模塊,用于從所述頁面結(jié)點(diǎn)樹的根節(jié)點(diǎn)開始,對所述頁面結(jié)點(diǎn)樹中的各個結(jié)點(diǎn)進(jìn)行深度優(yōu)先搜索。
5.根據(jù)權(quán)利要求4所述的裝置,其特征在于,其中,所述起始點(diǎn)為所述頁面節(jié)點(diǎn)樹的根結(jié)點(diǎn),其中,確定模塊包括:
追加模塊,用于在執(zhí)行所述深度優(yōu)先搜索的過程中,若未搜索到所述特征,則將搜索過的結(jié)點(diǎn)對應(yīng)的內(nèi)容追加入主體內(nèi)容中;
第一過濾模塊,用于若搜索到所述特征,記錄搜索到所述特征的特征點(diǎn),停止追加所述主體內(nèi)容,并將所述頁面結(jié)點(diǎn)樹中未搜索過的結(jié)點(diǎn)對應(yīng)的內(nèi)容過濾掉。
6.根據(jù)權(quán)利要求4所述的裝置,其特征在于,在過濾單元過濾之前,所述裝置還包括:
獲取模塊,用于獲取多個網(wǎng)絡(luò)平臺頁面;
提取模塊,用于從所述多個網(wǎng)絡(luò)平臺頁面中提取轉(zhuǎn)換信息,其中,所述轉(zhuǎn)換信息用于標(biāo)識由主體內(nèi)容轉(zhuǎn)換為非主體內(nèi)容;
生成模塊,用于基于提取到的轉(zhuǎn)換信息,生成所述特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611154627.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





