[發(fā)明專利]一種過濾網(wǎng)頁信息的方法和系統(tǒng)無效
| 申請?zhí)枺?/td> | 200910165227.0 | 申請日: | 2009-08-13 |
| 公開(公告)號: | CN101996203A | 公開(公告)日: | 2011-03-30 |
| 發(fā)明(設計)人: | 李曉軍;王聰智 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/00 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 逯長明;王寶筠 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 過濾 網(wǎng)頁 信息 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及互聯(lián)網(wǎng)技術領域,特別涉及一種過濾電子商務網(wǎng)站的網(wǎng)頁信息的方法和系統(tǒng)。
背景技術
電子商務通常是指是在全球各地廣泛的商業(yè)貿(mào)易活動中,在因特網(wǎng)開放的網(wǎng)絡環(huán)境下,基于瀏覽器/服務器應用方式,買賣雙方不謀面地進行各種商貿(mào)活動,實現(xiàn)消費者的網(wǎng)上購物、商戶之間的網(wǎng)上交易和在線電子支付以及各種商務活動、交易活動、金融活動和相關的綜合服務活動的一種新型的商業(yè)運營模式。一個電子商務網(wǎng)站,存在著龐大的用戶群及活躍的交易市場,具有海量信息的特征。隨著電子商務在線交易的普及,網(wǎng)站對信息的安全性、真實性存在著強烈的需求,同時用戶對交易信息的可靠性也很受關注,因此需要對電子商務交易中大量的交易信息,進行即時的安全性、可靠性、真實性處理。
現(xiàn)有技術中,需要使用一些特征甄別技術對信息的安全、真實性等進行過濾,例如,目前在一些的郵件系統(tǒng)、反垃圾系統(tǒng)中有使用概率論來過濾信息,其一般處理方案為預先設置一定的樣本空間,然后使用該樣本空間對信息進行過濾,該樣本空間中包括預先指定的特征信息,即是一些存在潛在危險的特征詞匯,并通過指定的計算公式,例如一般的郵件系統(tǒng)使用貝葉斯算法,來進行垃圾特征信息的計算和過濾。
但是在實際應用中,在郵件系統(tǒng)、反垃圾系統(tǒng)等中根據(jù)特征樣本庫來對信息進行貝葉斯分值計算,并根據(jù)分值確定信息是否屬于垃圾,僅僅是考慮到特征樣本庫中的特征信息在信息中出現(xiàn)的概率,而對于電子商務網(wǎng)站的網(wǎng)頁信息,存在著商品參數(shù)特征,例如:發(fā)布mp3時,商品參數(shù)是內(nèi)存容量、屏幕色彩等;也存在市場交易的行業(yè)特征,例如:單價、起訂量或供貨總量等,因此,對于電子商務網(wǎng)頁信息的過濾不能根據(jù)單一的概率分值來確定特征概率,否則會由于概率計算的遺漏,造成不安全的網(wǎng)頁信息也直接進行了發(fā)布,從而在電子商務網(wǎng)站上產(chǎn)生大量不真實、不安全的商品信息,甚至擾亂整個網(wǎng)上交易市場。
總之,目前需要本領域技術人員迫切解決的一個技術問題就是:如何能夠創(chuàng)新的提出一種過濾電子商務網(wǎng)站網(wǎng)頁信息的方法,以解決現(xiàn)有技術中僅僅根據(jù)特征信息出現(xiàn)的概率進行過濾,導致的過濾結(jié)果不夠準確的問題。
發(fā)明內(nèi)容
本申請所要解決的技術問題是提供一種過濾網(wǎng)頁信息的方法,用以解決現(xiàn)有技術中在需要導出大數(shù)據(jù)量的情況下,導致的過濾網(wǎng)頁信息效率較低的問題。
本申請還提供了一種過濾電子商務信息的系統(tǒng),用以保證上述方法在實際中的實現(xiàn)及應用。
為了解決上述問題,本申請公開了一種過濾網(wǎng)頁信息的方法,包括:
對用戶終端上傳的網(wǎng)頁信息進行檢測;
當檢測到所述網(wǎng)頁信息中包括預設的高危特征詞時,從預設的高危特征庫中匹配獲取與所述高危特征詞對應的至少一個高危規(guī)則;
根據(jù)所述至少一個高危規(guī)則在所述網(wǎng)頁信息中的匹配結(jié)果,獲取所述網(wǎng)頁信息的特征分值;
按照所述特征分值對所述網(wǎng)頁進行過濾。
本申請?zhí)峁┑囊环N過濾網(wǎng)頁信息的系統(tǒng),包括:
檢測單元,用于對用戶終端上傳的網(wǎng)頁信息進行檢測;
匹配獲取規(guī)則單元,用于當檢測到所述網(wǎng)頁信息中包括預設的高危特征詞時,從預設的高危特征庫中匹配獲取與所述高危特征詞對應的至少一個高危規(guī)則;
獲取特征分值單元,用于根據(jù)所述至少一個高危規(guī)則在所述網(wǎng)頁信息中的匹配結(jié)果,獲取所述網(wǎng)頁信息的特征分值;
過濾單元,用于按照所述特征分值對所述網(wǎng)頁信息進行過濾。
與現(xiàn)有技術相比,本申請包括以下優(yōu)點:
在本申請實施例中,針對當前網(wǎng)頁信息,在檢測到預設的高危特征詞出現(xiàn)時,同時根據(jù)預設的與高危特征詞對應的高危規(guī)則來進行當前網(wǎng)頁信息的特征分值的計算,并在過濾網(wǎng)頁信息時根據(jù)其特征分值的大小來進行過濾,與現(xiàn)有技術中僅僅根據(jù)樣本空間中的內(nèi)容在當前信息中出現(xiàn)的概率來判斷,本申請實施例更能準確的對網(wǎng)頁信息進行過濾,保證了網(wǎng)上交易的實時性、安全性和可靠性。進一步的,還可以保證高效的處理性能。當然,實施本申請的任一產(chǎn)品并不一定需要同時達到以上所述的所有優(yōu)點。
附圖說明
為了更清楚地說明本申請實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本申請的一種過濾網(wǎng)頁信息的方法實施例1的流程圖;
圖2是本申請的一種過濾網(wǎng)頁信息的方法實施例2的流程圖;
圖3是本申請的一種過濾網(wǎng)頁信息的方法實施例3的流程圖;
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910165227.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:起重機伸縮臂用鋼絲繩及其制作方法
- 下一篇:一種旋挖機用鋼絲繩及其制備方法
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





