[發明專利]一種異常行為檢測方法、計算設備及可讀存儲介質在審
| 申請號: | 202210083460.X | 申請日: | 2022-01-17 |
| 公開(公告)號: | CN114493250A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 鄧永國;范光亮 | 申請(專利權)人: | 北京齊爾布萊特科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q30/02 |
| 代理公司: | 北京思睿峰知識產權代理有限公司 11396 | 代理人: | 謝建云;趙愛軍 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 行為 檢測 方法 計算 設備 可讀 存儲 介質 | ||
本發明公開了一種異常行為檢測方法、計算設備及可讀存儲介質,該方法包括步驟:獲取行為數據樣本集,行為數據樣本集包括多個行為數據樣本;將行為數據樣本集中的行為數據樣本輸入到訓練好的自編碼器中進行處理,得到輸出數據;基于輸入的行為數據樣本和輸出數據,確定每個行為數據樣本對應的樣本誤差;基于所有行為數據樣本對應的樣本誤差,確定第一閾值;基于每個行為數據樣本的樣本誤差和第一閾值,得到每個行為數據樣本對應的第一風險評分;至少基于第一風險評分確定行為數據樣本是否異常。
技術領域
本發明涉及計算機技術領域,尤其涉及一種異常行為檢測方法、計算設備及可讀存儲介質。
背景技術
在機器學習領域,標注數據異常珍貴,在實際應用中,為數據進行標注有時會產生大量的人力物力成本,還會給用戶帶來較差的用戶體驗,例如在一些車媒體平臺上,用戶意向購車留資,即用戶對關注的車系車型留下手機號等資料,一直以來都是各汽車經銷商和汽車媒體平臺所關注的重點信息,若要為此類數據進行標注,則需要人工地對用戶留下的手機號進行電話回訪,方能獲知行為是否為用戶自愿行為或確認行為信息的真實性,而在電話回訪中也很難將所有的行為進行回訪確認,電話回訪不僅可能使用戶感到個人信息被侵犯,還會產生了大量的人力物力輸出。因此,在實際應用中,對無標簽的數據進行訓練具有廣闊的應用場景。
在檢測異常用戶行為的領域,現有的基于機器學習的檢測方法,通過對業務場景數據進行特征加工、訓練模型、根據模型結果進行風險評估,其缺點是業務人員無法了解模型給出結果的具體原因,結果的可靠性不足。
因此,亟需一種能夠采用未標注數據來檢測異常行為的方法,提高檢測的準確率。
發明內容
為此,本發明提供了一種異常行為檢測方法、計算設備及可讀存儲介質,以力圖解決或者至少緩解上面存在的至少一個問題。
根據本發明的一個方面,提供了一種異常行為檢測方法,在計算設備中執行,方法包括步驟:獲取行為數據樣本集,行為數據樣本集包括多個行為數據樣本;將行為數據樣本集中的行為數據樣本輸入到訓練好的自編碼器中進行處理,得到輸出數據;基于輸入的行為數據樣本和輸出數據,確定每個行為數據樣本對應的樣本誤差;基于所有行為數據樣本對應的樣本誤差,確定第一閾值;基于每個行為數據樣本的樣本誤差和第一閾值,得到每個行為數據樣本對應的第一風險評分;至少基于第一風險評分確定行為數據樣本是否異常。
可選地,在根據本發明的異常行為檢測方法中,還包括步驟:基于預定異常行為檢測策略對行為數據樣本集進行評估,得到每個行為數據樣本對應的第二風險評分;將第一風險評分和第二風險評分進行融合處理,得到每個行為數據樣本對應的第三風險評分。
可選地,在根據本發明的異常行為檢測方法中,至少基于第一風險評分確定行為數據樣本是否異常的步驟,包括:基于第三風險評分確定行為數據樣本是否異常。
可選地,在根據本發明的異常行為檢測方法中,基于第三風險評分確定行為數據樣本是否異常的步驟,包括:基于所有行為數據樣本對應的第三風險評分,確定風險評估等級的閾值;基于風險評估等級的閾值,確定行為數據樣本對應的風險評估等級。
可選地,在根據本發明的異常行為檢測方法中,在將行為數據樣本集中的行為數據樣本輸入到訓練好的自編碼器中進行處理的步驟之前,還包括:對行為數據樣本集進行預處理。
可選地,在根據本發明的異常行為檢測方法中,行為數據樣本包括至少一個行為數據,其中,對行為數據樣本集進行預處理的步驟,包括:若行為數據樣本集中一個行為數據樣本所包括的行為數據具有缺失值,且缺失值的數量超過行為數據總數的第一預定值,則將該行為數據樣本進行舍棄;若行為數據樣本集中一個行為數據樣本所包括的行為數據具有缺失值,但缺失值的數量未超過行為數據總數的第一預定值,則對該行為數據樣本的缺失值進行填充。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京齊爾布萊特科技有限公司,未經北京齊爾布萊特科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210083460.X/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





