[發明專利]一種防刷機設備指紋相似度識別方法和裝置有效
| 申請號: | 202111618802.5 | 申請日: | 2021-12-28 |
| 公開(公告)號: | CN113989859B | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 樂正宜;王滕滕 | 申請(專利權)人: | 江蘇蘇寧銀行股份有限公司 |
| 主分類號: | G06V40/12 | 分類號: | G06V40/12;G06V10/74;G06V10/762;G06V10/764;G06V10/774 |
| 代理公司: | 南京瑞華騰知識產權代理事務所(普通合伙) 32368 | 代理人: | 錢麗 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 防刷機 設備 指紋 相似 識別 方法 裝置 | ||
1.一種防刷機設備指紋相似度識別方法,其特征在于,包括如下步驟:
收集設備指紋的特征字段,所述特征字段為從用戶登陸行為數據中提取的包括簡單統計量、集合型特征和帶時間戳集合型特征的字段;
計算兩兩設備指紋的各特征字段間的相似性分數;
根據預設的相似性分數閾值,判斷兩兩設備指紋是否為同一設備,并添加標簽,所述標簽包括是、否或未知;
采用是或否標簽對應的設備指紋相似性分數構建監督學習模型并輸出;
將未知標簽對應的設備指紋相似性分數輸入監督學習模型中進行識別,獲得識別結果;
其中,所述帶時間戳集合型特征為在集合型特征的歷史取值基礎上附上對應的時間,設兩兩設備指紋的帶時間戳集合型特征分別為:
;
則所述帶時間戳集合型特征的相似性分數根據特征類型分為:
時間規律相似性:
;
上式中,和分別為設備指紋i和設備指紋j的帶時間戳集合型特征,…為中第1至n個元素,…為中第1至m個元素,為Test相似性函數;
連續事件相似度:
上式中,為連續事件對個數。
2.根據權利要求1所述的防刷機設備指紋相似度識別方法,其特征在于,
所述簡單統計量為根據設備指紋記錄計算出的數值統計量;
所述集合型特征為將頁面瀏覽記錄、交易信息和IP解析地理信息進行關聯匹配后,結合設備指紋記錄的所有歷史取值。
3.根據權利要求2所述的防刷機設備指紋相似度識別方法,其特征在于,所述兩兩設備指紋為被同一用戶使用過的設備指紋對,則
所述簡單統計量的相似性分數的計算公式包括:
差值:;
差值絕對值:;
平方差:;
比例:;
其中, 、分別為兩兩設備指紋的數值型特征。
4.根據權利要求2所述的防刷機設備指紋相似度識別方法,其特征在于,設所述兩兩設備指紋的集合型特征分別為,;
則所述集合型特征的相似性分數根據特征類型分為8種,分別為:
Jaccard相似性:
取值比例相似性:
其中,OccSimilarity( )為取值比例相似性,Eucliden Distance( )為Eucliden距離函數, 為集合 、中各元素出現比例集合,為集合、中出現k個不同元素,為元素k1在集合中出現次數占總集合中的比例;
Welch’s T-Test相似性:
Mann Whiteny U-Test 相似性:
User Agent 序列相似性:
其中,為比較兩條User Agent 和的相似性函數, 和分別為設備指紋i和設備指紋j中所有User Agent的集合;
IP地址相似性:
其中, 為第i段IP地址的OccSimilarity相似性;
ScreenResolution 相似性:
其中,和分別為屏幕分辨率中高度、寬度的相似性;
文本相似性:
其中,為設備指紋i和設備指紋j之間的文本相似性,Occ()為OccSimilarity相似性分數。
5.根據權利要求1所述的防刷機設備指紋相似度識別方法,其特征在于,在所述收集設備指紋的特征字段之后,還包括對所述特征字段進行變量平方差篩選和隨機森林模型篩選;
所述變量平方差篩選為去掉特征相似性分數平方差為0的特征字段;
所述隨機森林模型篩選包括利用隨機森林的每棵樹的樹節點將特征字段的數據集分割成兩類,每個樹節點對應一個篩選條件,將相似的一類特征字段放在一起,以減少模型的不純度,通過計算減少每棵樹不純度的平均值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇蘇寧銀行股份有限公司,未經江蘇蘇寧銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111618802.5/1.html,轉載請聲明來源鉆瓜專利網。





