[發(fā)明專利]廣告過濾方法和裝置有效
| 申請?zhí)枺?/td> | 201410180750.1 | 申請日: | 2014-04-30 |
| 公開(公告)號: | CN105095236A | 公開(公告)日: | 2015-11-25 |
| 發(fā)明(設(shè)計)人: | 田文 | 申請(專利權(quán))人: | 優(yōu)視科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京博浩百睿知識產(chǎn)權(quán)代理有限責任公司 11134 | 代理人: | 宋子良 |
| 地址: | 100080 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 廣告 過濾 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及瀏覽器領(lǐng)域,具體而言,涉及一種廣告過濾方法和裝置。
背景技術(shù)
在瀏覽器上,廣告過濾插件adblock是一個廣泛應(yīng)用的廣告過濾插件。其基本原理是設(shè)置一系列的過濾規(guī)則,在瀏覽器發(fā)出資源請求之前,先檢查其統(tǒng)一資源定位符(UniformResourceLocator,簡稱url)是否命中某條過濾規(guī)則,如果命中某條過濾規(guī)則,可以確定瀏覽器請求的資源為廣告,瀏覽器無需請求該資源。
為了達到較好的過濾效果,通常需要設(shè)置較多的過濾規(guī)則,比如adblock提供的過濾規(guī)則就超過2萬條。目前的瀏覽器廣告過濾方法是:當用戶通過瀏覽器輸入某個url時,利用該url逐個對過濾規(guī)則進行匹配,如果匹配上某個過濾規(guī)則,則返回true(表示需要進行廣告過濾),否則返回false(表示不需要進行廣告過濾)。由于在瀏覽器中設(shè)置有大量的廣告的過濾規(guī)則,在瀏覽器每一次網(wǎng)絡(luò)請求時,與大量的過濾規(guī)則逐個進行匹配,使得廣告過濾時性能開銷較大,同時由于過濾規(guī)則數(shù)量大,導(dǎo)致每次廣告過濾時間長。
針對現(xiàn)有技術(shù)中由于過濾規(guī)則數(shù)量大導(dǎo)致每次廣告過濾時間長的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種廣告過濾方法和裝置,以解決由于過濾規(guī)則數(shù)量大導(dǎo)致每次廣告過濾時間長問題。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種廣告過濾方法。根據(jù)本發(fā)明的瀏覽器廣告過濾方法包括:獲取在瀏覽器中輸入的統(tǒng)一資源定位符;利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配;如果所述統(tǒng)一資源定位符與所述關(guān)鍵字匹配,則將所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配;以及如果所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則匹配,則利用所述廣告過濾規(guī)則進行廣告過濾。
進一步地,在所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配之前,所述瀏覽器廣告過濾方法還包括:獲取與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字;建立與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字的字典樹;其中,所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配步驟包括:獲取所述字典樹中的關(guān)鍵字;判斷所述統(tǒng)一資源定位符與所述字典樹中的關(guān)鍵字是否匹配。
進一步地,所述獲取與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字包括:讀取所述廣告過濾規(guī)則的文件;從所述廣告過濾規(guī)則的文件中提取所述關(guān)鍵字;所述建立與廣告過濾規(guī)則對應(yīng)的關(guān)鍵字的字典樹包括:建立所述關(guān)鍵字與所述廣告過濾規(guī)則的對應(yīng)關(guān)系;根據(jù)提取的關(guān)鍵字建立所述字典樹。
進一步地,所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配包括:判斷所述統(tǒng)一資源定位符與所述廣告過濾規(guī)則的關(guān)鍵字是否匹配,其中,如果判斷出所述統(tǒng)一資源定位符與所述廣告過濾規(guī)則的關(guān)鍵字匹配,則將所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則轉(zhuǎn)換為正則表達式;將所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配包括:將所述統(tǒng)一資源定位符與所述正則表達式進行匹配;其中,如果所述統(tǒng)一資源定位符與所述正則表達式匹配,則輸出所述正則表達式對應(yīng)的廣告過濾規(guī)則,通過輸出的所述正則表達式對應(yīng)的廣告過濾規(guī)則進行廣告過濾。
進一步地,在所述獲取在瀏覽器中輸入的統(tǒng)一資源定位符之后,所述瀏覽器廣告過濾方法還包括:將所述統(tǒng)一資源定位符傳入分段器;在所述分段器中對所述統(tǒng)一資源定位符進行分段,得到多個分段字符;其中,所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配包括:逐個將所述多個分段字符與關(guān)鍵字匹配器中的關(guān)鍵字進行匹配。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種廣告過濾裝置。根據(jù)本發(fā)明的瀏覽器廣告過濾裝置包括:第一獲取單元,用于獲取在瀏覽器中輸入的統(tǒng)一資源定位符;第一匹配單元,用于利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配;第二匹配單元,用于當所述統(tǒng)一資源定位符與所述關(guān)鍵字匹配時,將所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配;以及過濾單元,用于當所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則匹配時,利用所述廣告過濾規(guī)則進行廣告過濾。
進一步地,所述瀏覽器廣告過濾裝置還包括:第二獲取單元,用于在所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配之前,獲取與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字;建立單元,用于建立與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字的字典樹;其中,所述第一匹配單元包括:獲取模塊,用于獲取所述字典樹中的關(guān)鍵字;第一判斷模塊,用于判斷所述統(tǒng)一資源定位符與所述字典樹中的關(guān)鍵字是否匹配。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于優(yōu)視科技有限公司,未經(jīng)優(yōu)視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410180750.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





