[發明專利]一種網吧客戶機IP范圍識別方法有效
| 申請號: | 201811122944.0 | 申請日: | 2018-09-26 |
| 公開(公告)號: | CN109327556B | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 趙麗麗;祝小斌 | 申請(專利權)人: | 武漢文網億聯科技有限公司 |
| 主分類號: | H04L29/12 | 分類號: | H04L29/12 |
| 代理公司: | 武漢匯知云專利代理事務所(普通合伙) 42283 | 代理人: | 張熔舟 |
| 地址: | 430000 湖北省武漢市東湖新技術開發區*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網吧 客戶機 ip 范圍 識別 方法 | ||
1.一種網吧客戶機IP范圍識別方法,其特征在于,包括以下步驟:
(1)數據采集:有兩種數據采集方式,其中,第一種數據采集是通過路由器每隔半小時監控網吧在線IP地址、mac地址和是否安裝客戶端;第二種數據采集是網吧中安裝了客戶端的電腦,每次開機關機都會通過客戶端上傳上網人員信息、客戶機IP信息,數據采集次數不固定,且為累計數據;
(2)獲取全部IP和安裝客戶端IP:通過步驟(1)中的兩種數據采集方式獲得數據后合并得到網吧的全部IP,并從網吧全部IP中去識別客戶機IP范圍;將兩種數據中安裝客戶端的IP進行合并,得到網吧全部安裝客戶端的IP;
(3)識別客戶機IP的規則:篩選出MAC地址對應出現的且MAC地址被采集比例≤β的MAC地址,則MAC地址對應的IP地址即為客戶機IP,其中和β為待確定的參數;
(4)需斷網的客戶機IP范圍的識別
根據步驟(3)的客戶機IP規則識別出客戶機IP,進而識別出需斷網的客戶機IP范圍,包括下述子步驟:
(4-1)確定樣本:選擇湖北省、湖南省、廣東省、四川省中受文網衛士監管且客戶端安裝率為100%的所有網吧在某一時間段的第一種采集數據和第二種采集數據作為樣本;
(4-2)確定網吧全部IP和真實客戶機IP:采用步驟(2)的方法獲取網吧全部IP和全部安裝客戶端的IP,而安裝率100%的網吧,即每臺客戶機都安裝客戶端,全部安裝客戶端的IP即為客戶機IP的全量范圍,即網吧的真實客戶機IP;
(4-3)提取變量:使用步驟(1)中的第一種采集數據,能每隔半小時獲取網吧在線mac地址和ip地址,統計出樣本中每個網吧每個mac地址對應的IP數以及Mac地址被采集的次數;
(4-4)預測客戶機IP:根據(4-3)中提取的變量,篩選出MAC地址對應出現的且MAC地址被采集比例≤β的MAC地址,將其對應的IP地址當做預測的客戶機IP;其中,取值范圍大于等于1,β取值范圍在0-1之間;
(4-5)確定客戶機IP范圍:剔除預測的客戶機IP中不屬于連續區間范圍內的離群IP值,對步驟(4-4)中使用和β參數得到的客戶機IP進行分段,根據取值比較連續的IP分成一段,IP間隔較大的進行分段的原則,確定分段間隔gap1和段內數量gap2,得到不同的IP段并確定劃分的段是否為非離群的個體或區間,也即只有達到一定樣本量的區間才被當做客戶機IP范圍;
(4-6)預測正確率:將根據步驟(4-1)至(4-5)后所得的預測的客戶機IP范圍與真實客戶機IP使用第一正確率和第二錯誤率來衡量最終的正確率;
其中,第一種正確率:真實客戶機IP中被預測為客戶機IP的比例=真實客戶機中落入預測的客戶機IP范圍中的IP數/真實客戶機中IP總數;
第二種錯誤率:預測的客戶機IP中非真實客戶機IP的比例=預測的客戶機IP在預測的客戶機IP范圍中但不在真實客戶機IP中的IP總數/預測的客戶機IP在預測的客戶機IP范圍中的總數;
(4-7)調參:根據(4-6)中的公式計算所有網吧所有網段的第一種正確率的均值和第二種錯誤率的均值,去衡量整體預測效果;其中,第一個正確率越高、第二個錯誤率越低表明預測效果越好;
(5)根據步驟(4-1)至(4-7)循環設置β、gap1和gap2的參數,并從整體預測效果最佳的角度確定β、gap1和gap2的取值,確定四個參數后,使用和β參數篩選MAC地址對應出現的且MAC地址被采集比例≤β的MAC地址,其對應的IP地址即為預測的客戶機IP,然后將預測的客戶機IP由小到大排序,將相鄰間隔超過gap1的進行分段,將IP數量超過gap2的段當做客戶機IP范圍。
2.根據權利要求1所述的一種網吧客戶機IP范圍識別方法,其特征在于,第一種采集方式的具體方法為:路由器通過UDP廣播包通知客戶端,客戶端收到廣播包后回應約定的消息給路由器,路由器根據客戶端的回應來判斷是否安裝,并將網吧在線Mac地址、IP地址和是否安裝客戶端的標識變量上傳到Hadoop平臺,一天共采集網吧48次數據。
3.根據權利要求1所述的一種網吧客戶機IP范圍識別方法,其特征在于,所述MAC地址被采集比例為在第一種數據采集中MAC地址被采集的次數與固定采集次數的比值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢文網億聯科技有限公司,未經武漢文網億聯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811122944.0/1.html,轉載請聲明來源鉆瓜專利網。





