[發明專利]數據類型的確定方法和裝置、存儲介質及電子裝置有效
| 申請號: | 201910964629.0 | 申請日: | 2019-10-11 |
| 公開(公告)號: | CN110781433B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 余意 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06Q30/0241;G06F18/2431;G06N3/0475;G06N3/094 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 張秀英 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據類型 確定 方法 裝置 存儲 介質 電子 | ||
本發明公開了一種數據類型的確定方法和裝置、存儲介質及電子裝置。其中,該方法包括:獲取待處理數據的第一目標序列數據,將該第一目標序列數據輸入預先訓練好的對抗網絡模型中,得到該對抗網絡模型輸出的該待處理數據屬于正常類型的目標概率,在目標概率大于或等于預設閾值的情況下,確定該待處理數據該屬于該正常類型;否則,確定該待處理數據屬于異常類型。本發明實施例通過預先訓練好的對抗網絡模型確定待處理數據為正常數據的概率,從而判斷待處理數據是正常或異常數據,解決了現有技術中基于隨機森林的方法由于每次選擇特征時都是隨機選擇,導致在維度過高的情況下異常數據確定的效果會大幅度下降的技術問題。
技術領域
本發明涉及計算機領域,具體而言,涉及一種數據類型的確定方法和裝置、存儲介質及電子裝置。
背景技術
反作弊領域,現有大多使用傳統的統計方法或者孤立森林來進行作弊行為檢測或者異常檢測。
相關技術中提出一種識別作弊流量的方法及裝置,該方案從訪問頁面停留時長分布的角度分析,記錄用戶的訪問頁面流量的停留時長,然后對比該渠道的設定時長的訪問額流量頁面停留時長分布,將兩者對比,如果不同,則表示該訪問記錄異常,屬于作弊流量。
基于統計的方法只能針對一維的特征,根據維度的歷史行為形成一個分布,通過分布來區分正常樣本和異常樣本。此方法缺點為特征只有一個維度過于單一,區分度不夠,而且通常基于某個假設,即不服從某個分布則為異常樣本,但是現實場景往往存在多個正常分布,無法預設所有的分布。
相關技術中還提出異常申請檢測方法,該方案應用于信貸申請領域,將信貸申請數據提取特征,輸入到孤立森林模型,直接輸出申請數據是否屬于異常申請,孤立森林模型是直接基于無標簽數據進行訓練。
基于隨機森林的方法在維度過高的情況下效果會大幅度下降,每次選擇特征的時候都是隨機選擇,會導致有些重要特征沒有被使用,如直接輸入時間序列特征,則效果很差,還需要增加一層時間序列特征提取流程。
針對上述的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種數據類型的確定方法和裝置、存儲介質及電子裝置,以至少解決現有技術中基于隨機森林的方法由于每次選擇特征時都是隨機選擇,導致在維度過高的情況下異常數據確定的效果會大幅度下降的技術問題。
根據本發明實施例的一方面,還提供了一種數據類型的確定方法,包括:
獲取待處理數據的第一目標序列數據,其中,該第一目標序列數據是從該待處理數據中按照時間序列提取的多個維度的序列數據;
將該第一目標序列數據輸入預先訓練好的對抗網絡模型中,得到該對抗網絡模型輸出的該待處理數據屬于正常類型的目標概率,其中,該對抗網絡模型用于將該第一目標序列數據進行重構,得到第二目標序列數據,并根據該第一目標序列數據與該第二目標序列數據之間的重構誤差確定該目標概率,該目標概率與該重構誤差負相關,該對抗網絡模型是基于該正常類型的訓練數據進行訓練得到的模型,該對抗網絡模型用于在輸入數據為該正常類型的數據時輸出的所述輸入數據為正常類型的概率大于或等于預設閾值;
在該目標概率大于或等于預設閾值的情況下,確定該待處理數據該屬于該正常類型;在該目標概率小于該預設閾值的情況下,確定該待處理數據不屬于該正常類型。
根據本發明實施例的另一方面,還提供了一種數據類型的確定裝置,包括:
第一獲取模塊,用于獲取待處理數據的第一目標序列數據,其中,該第一目標序列數據是從該待處理數據中按照時間序列提取的多個維度的序列數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910964629.0/2.html,轉載請聲明來源鉆瓜專利網。





