[發(fā)明專利]一種信息檢測方法、裝置及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010300786.4 | 申請日: | 2020-04-16 |
| 公開(公告)號: | CN111476610B | 公開(公告)日: | 2023-06-09 |
| 發(fā)明(設(shè)計)人: | 黃煒程 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/00 | 分類號: | G06F17/00;G06Q30/02;G06F16/951 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300 | 代理人: | 蔡艾瑩 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 信息 檢測 方法 裝置 計算機 可讀 存儲 介質(zhì) | ||
本申請實施例公開了一種信息檢測方法、裝置及計算機可讀存儲介質(zhì),本申請實施例通過采集網(wǎng)絡(luò)樣本信息,并按照時間維度將網(wǎng)絡(luò)樣本信息進行排序,生成正樣本序列;基于正樣本序列得到正樣本對信息,并根據(jù)正樣本對信息構(gòu)建轉(zhuǎn)移概率矩陣;獲取待檢測序列,并結(jié)合轉(zhuǎn)移概率矩陣計算待檢測序列的目標(biāo)概率;當(dāng)檢測到目標(biāo)概率小于預(yù)設(shè)閾值時,將待檢測序列相應(yīng)的客戶端確定為異常客戶端。以此,通過采集網(wǎng)絡(luò)樣本信息生成正樣本序列,對正樣本序列進行拆分,得到正樣本對信息構(gòu)建轉(zhuǎn)移概率矩陣,結(jié)合轉(zhuǎn)移概率矩陣計算待檢測序列的目標(biāo)概率,在目標(biāo)概率不符合條件時,將該待檢測序列相應(yīng)的客戶端確定為異常客戶端并進行防護,極大的提升了信息檢測的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請涉及信息檢測技術(shù)領(lǐng)域,具體涉及一種信息檢測方法、裝置及計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著網(wǎng)絡(luò)的發(fā)展和計算機的廣泛應(yīng)用,線上信息推廣市場迅速擴展,出錢投放廣告的廣告主可以向推送平臺付費,通過網(wǎng)頁、搜索引擎、應(yīng)用程序或者其他平臺來投放自己的廣告,從而很好的推廣自己的產(chǎn)品。但是,在巨大的利益驅(qū)使下,廣告爬蟲問題越來越嚴(yán)重,廣告爬蟲可以爬取廣告的信息,達到挖掘客戶、盜取素材和破壞流量等目的,會導(dǎo)致廣告主流失,商業(yè)數(shù)據(jù)泄露,造成巨大的經(jīng)濟損失。
現(xiàn)有技術(shù)中,可以獲取客戶端的使用信息生成相應(yīng)的用戶畫像,從而根據(jù)用戶畫像檢測客戶端是否為異常客戶端,在檢測到客戶端為異常客戶端的狀態(tài)下,會對該異常客戶端形成固定標(biāo)簽并推送特定的廣告,使異常客戶端爬取信息受限,從而保護廣告主。
在對現(xiàn)有技術(shù)的研究和實踐過程中,本申請的發(fā)明人發(fā)現(xiàn),現(xiàn)有技術(shù)中,廣告爬蟲可以對自身的用戶畫像進行篡改,將客戶端偽裝成正常客戶端,從而繼續(xù)進行惡意爬取,因此信息檢測的準(zhǔn)確率較低。
發(fā)明內(nèi)容
本申請實施例提供一種信息檢測方法、裝置及計算機可讀存儲介質(zhì),可以提升信息檢測的準(zhǔn)確率。
為解決上述技術(shù)問題,本申請實施例提供以下技術(shù)方案:
一種信息檢測方法,包括:
采集網(wǎng)絡(luò)樣本信息,并按照時間維度將所述網(wǎng)絡(luò)樣本信息進行排序,生成正樣本序列;
基于所述正樣本序列得到正樣本對信息,并根據(jù)所述正樣本對信息構(gòu)建轉(zhuǎn)移概率矩陣;
獲取待檢測序列,并結(jié)合所述轉(zhuǎn)移概率矩陣計算所述待檢測序列的目標(biāo)概率;
當(dāng)檢測到所述目標(biāo)概率小于預(yù)設(shè)閾值時,將所述待檢測序列相應(yīng)的客戶端確定為異常客戶端。
一種信息檢測裝置,包括:
采集單元,用于采集網(wǎng)絡(luò)樣本信息,并按照時間維度將所述網(wǎng)絡(luò)樣本信息進行排序,生成正樣本序列;
構(gòu)建單元,用于基于所述正樣本序列得到正樣本對信息,并根據(jù)所述正樣本對信息構(gòu)建轉(zhuǎn)移概率矩陣;
計算單元,用于獲取待檢測序列,并結(jié)合所述轉(zhuǎn)移概率矩陣計算所述待檢測序列的目標(biāo)概率;
異常確定單元,用于當(dāng)檢測到所述目標(biāo)概率小于預(yù)設(shè)閾值時,將所述待檢測序列相應(yīng)的客戶端確定為異常客戶端。
在一些實施例中,所述計算單元,用于:
依次獲取所述待檢測序列中相鄰的待檢測網(wǎng)絡(luò)信息,并將所述相鄰的待檢測網(wǎng)絡(luò)信息組合,生成待檢測對信息;
基于所述轉(zhuǎn)移概率矩陣獲取每一待檢測對信息的概率;
將所述每一待檢測對信息的概率進行乘積運算,得到所述目標(biāo)概率。
在一些實施例中,所述裝置還包括預(yù)設(shè)閾值確定單元,用于:
獲取所述待檢測序列的目標(biāo)序列長度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010300786.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





