[發明專利]一種智能車站反刷票方法和反刷票系統有效
| 申請號: | 202010090896.2 | 申請日: | 2020-02-13 |
| 公開(公告)號: | CN111292099B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 田野;李建中;吳宗澤;周健鈞;李俊彬 | 申請(專利權)人: | 廣東工業大學 |
| 主分類號: | G06Q30/018 | 分類號: | G06Q30/018;G06Q50/30;G06F18/23213;G06N3/043;G06N3/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 510060 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 車站 反刷票 方法 系統 | ||
1.一種智能車站反刷票方法,其特征在于,所述方法包括以下步驟:
S1:將歷史購票數據集存入大數據計算分析系統的Hive數據倉庫中,并進行數據預處理,得到下一步算法需要的各個指標點;
S2:使用K-Means算法按賬號作為用戶唯一標識進行用戶畫像構建并存儲;
S3:構建模糊神經網絡模型,使用歷史數據結合用戶畫像生成訓練集,并由專家統計分析給出算法所需隸屬函數,進而訓練模糊神經網絡模型;
S4:采用經過訓練的模糊神經網絡,對實時購票請求進行分析處理,得到的結果反饋給下游業務系統;業務系統接收分析處理結果,根據懲罰規則進行放行或懲罰;
S1包括以下步驟:
S1.1:在大數據計算分析系統的Hive中建立購票請求數據表和用戶賬號數據表;并將往年歷史數據導入購票請求數據表和用戶賬號數據表中;
S1.2:根據請求多種原始購票和賬號數據統計出以下的數據指標:
USER_ID:用戶賬號,
T_IDSER:身份證號碼,
T_MOST_TYPE:成功訂單座位類型總數的有座與無座次數差值,
USER_PREFER_SRC:常用乘車的出發站點,
USER_PREFER_DES:最多次數乘車的目的地站點,
USER_GPS:設備定位地址,
IP_LOCATION:發出請求的IP歸屬地,
REQ_DENSITY:每秒請求次數,
CHECK_TIME_AVG:平均請求時間間隔,
USER_ADDRESS:推測居住地;
S1.3:根據S1.2的統計結果統計出以下的數據指標:
USER_ID:用戶賬號,
T_IDSER:身份證號碼,
USER_GPS_COUNT:手機購票次數,
CHECK_TIME_AVG:平均請求時間間隔,
T_MOST_TYPE:成功訂單座位中的有座票與無座票次數差值,
USER_ADDRESS_REQ_RATIO:于推測居住地發起購票次數于與總購票次數比值;
S2包括以下步驟:
S2.1:構建系統處理用戶購票請求的優先度規則,優先度為1-5,數字越高表示越優先處理:
手機購票次數越多的用戶,優先度增加;
ip或賬號的單個時間內請求次數也就是頻率越大,優先度降低;
購票ip歸屬地長期非賬戶推測居住地,優先度降低;
T_MOST_TYPE的值高于所有用戶的平均水平,優先度越高;
S2.2:通過對USER_ID和T_IDSER兩個指標以外的指標進行歸一化,然后根據S2.1的優先度規則給出五個初始訓練樣本,從上到下對應優先級5至1:
(x1,y1,1.00,0.00,1.00,1.00,5),
(x2,y2,0.80,0.25,0.80,0.80,4),
(x3,y3,0.50,0.50,0.50,0.50,3),
(x4,y4,0.25,0.80,0.25,0.25,2),
(x5,y5,0.00,1.00,0.00,0.00,1)
其中,上述五個樣本的格式為:(USER_ID,T_IDSER,USER_GPS_COUNT_NORMAL,CHECK_TIME_AVG_NORMAL,USER_ADDRESS_REQ_RATIO_NORMAL,T_MOST_TYPE_NORMAL,PRI_LABEL);
PRI_LABEL為優先級標簽,后綴為_NORMAL的表示原字段值歸一化后的結果;
x1-x5,y1-y5分別表示不同的USER_ID,T_IDSER;
S2.3:根據S2.2給出的五個自定義樣本點作為簇中心,從上到下分別為μ1,μ2,μ3,μ4,μ5,將S1.3中所描述的預處理后的用戶購票;
歷史數據集作為輸入;每條數據稱為一個樣本xm,∈[1,n],n表示數據總數;按照以下過程進行計算:
(1)計算每個樣本xm與各“簇中心”向量的歐式距離,根據距離最近的“簇中心”向量確定xm的簇標記:
γm=argmin||xm-μi||2,i=1,2,…5
其中argmin是使目標函數取最小值時的變量值;
(2)更新各個簇中心:
其中ni表示為屬于簇i的樣本總數;
(3)判斷簇標簽是否達到收斂精度,若達到,則輸出各簇中心;若未達到,則返回步驟(2);直到簇標簽達到預設的收斂精度為止;
S2.4:通過Flink計算引擎得出的處理優先度,還需在計算中關聯S1所述歷史數據中每個賬號本身的其他數據,才是完整的用戶畫像數據,完整數據格式為:
USER_ID:用戶賬號,T_IDSER:身份證號碼,
USER_PREFER_SRC:常用的乘車出發站點,
USER_PREFER_DES:常用的乘車目的地站點,
USER_ADDRESS:推測居住地,
PRI_LABEL:請求的處理優先級;
上述格式的數據直接存儲至Redis數據庫中,在售票期間供實時計算過程使用;
S3包括以下步驟:
S3.1:提出購票期間的異常購票行為識別根據:
(1)同一ip或者賬號請求頻率大于正常行為數據集得到的均值;
(2)同一ip或者賬號購票請求包含不同乘車人數量大于正常平均值;
(3)同一ip或者賬號以大于正常平均值的次數購買自身畫像定義常來往車站之外的車站車票的次數;
(4)S2.4中獲得的處理優先級,缺失則默認為(3);
以上包含的正常行為平均值數據在進行歷史數據分析時一并計算得出并存入數據庫用于下一步訓練模型和實時計算中使用;
S3.2:建立并訓練模糊神經網絡模塊模型,內容包括:
S3.3:利用訓練后的模型完成計算任務;
1)將經過訓練的模型文件,存儲到大數據計算分析系統中等待調用;
2)實時購票數據進入運行中的計算分析系統進行計算;
3)將輸出的y值交給下游業務系統;
其中,y值是用戶實時購票請求數據所展現的特征,表示跟黃牛刷票行為的特征的相似度是多少,為0.0到1.0中間的一個數;
S4包括以下步驟:
S4.1:提出以下懲罰處理規則:
將請求數據代入訓練完畢的模糊神經網絡模型進行計算,計算結果是一個概率值,表示此短時間內此賬號購票行為是黃牛刷票的可能性,
設計算結果0.0-0.1,0.1-0.2,0.2-0.4,0.4-0.7,0.7-0.9,0.9-1.0分別表示當前購票行為數據是黃牛刷票的可能性為0到5級一共六種;
依次對應六種懲罰方式分別為:
0級放行,1級ip延后處理5%,2級ip延后處理10%,3級ip延后處理40%,4級ip延后處理90%,5級ip直接封禁;
S4.2:根據S4.1給出的懲罰等級進行懲罰處理;
根據S4.1給出的懲罰等級,如果是0級則直接正常處理,1級以上則根據不同等級對應的延后處理百分比,將當前需要懲罰的用戶請求放到全量請求隊列的前百分之多少進行排隊等候或者直接封禁。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業大學,未經廣東工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010090896.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全網智能銷售管理系統
- 下一篇:基于視線追蹤的校準方法及相關裝置





