[發明專利]模型參數計算方法、數據類型識別方法、裝置和服務器在審
| 申請號: | 201811541467.1 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109947816A | 公開(公告)日: | 2019-06-28 |
| 發明(設計)人: | 劉向峰;劉穎蓓;錢坤 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 李輝 |
| 地址: | 英屬開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型參數計算 數據類型識別 歷史數據 異常數據 閾值參數 服務器 位位置 | ||
1.一種模型參數計算方法,包括:
基于時間長度超參數,獲取距離當前時刻最近的多個歷史數據;
基于分位位置超參數,獲取所述多個歷史數據的分位數;
基于異常程度超參數和所述分位數,計算閾值參數;所述閾值參數用于識別異常數據。
2.如權利要求1所述的方法,在獲取分位數的步驟中包括:
對所述多個歷史數據進行排序,得到排序后的所述多個歷史數據;
基于分位位置超參數,獲取排序后的所述多個歷史數據的分位數。
3.如權利要求1所述的方法,所述分位位置超參數包括第一分位位置超參數和第二分位位置超參數;在獲取分位數的步驟中包括:
基于所述第一分位位置超參數,獲取所述多個歷史數據的第一分位數;
基于所述第二分位位置超參數,獲取所述多個歷史數據的第二分位數;
相應地,在計算閾值參數的步驟中包括:
基于異常程度超參數、所述第一分位數和所述第二分位數,計算閾值參數。
4.如權利要求1所述的方法,所述閾值參數包括第一閾值參數;所述第一閾值參數用于識別異常數據;基于所述第一閾值參數識別的異常數據小于正常數據。
5.如權利要求4所述的方法,所述分位數包括第一分位數和第二分位數;所述第一分位數小于所述第二分位數;在計算第一閾值參數的步驟中包括:
計算所述第一分位數和所述第二分位數的差值;
基于異常程度超參數、所述差值和所述第一分位數,計算所述第一閾值參數。
6.如權利要求1所述的方法,所述閾值參數包括第二閾值參數;所述第二閾值參數用于識別異常數據;基于所述第二閾值參數識別的異常數據大于正常數據。
7.如權利要求6所述的方法,所述分位數包括第一分位數和第二分位數;所述第一分位數小于所述第二分位數;在計算第二閾值參數的步驟中包括:
計算所述第一分位數和所述第二分位數的差值;
基于異常程度超參數、所述差值和所述第二分位數,計算所述第二閾值參數。
8.如權利要求1所述的方法,所述時間長度超參數、所述分位位置超參數和所述異常程度超參數采用如下方式確定:
使用多個訓練數據,訓練多個模型;所述多個模型基于多個候選超參數集合構建;每個候選超參數集合包括時間長度超參數、分位位置超參數和異常程度超參數;
使用多個檢測數據,計算訓練后的所述多個模型的評價指標;
基于所述評價指標,從所述多個候選超參數集合中選取目標候選超參數集合。
9.一種模型參數計算裝置,包括:
獲取單元,用于基于時間長度超參數,獲取距離當前時刻最近的多個歷史數據;
確定單元,用于基于分位位置超參數,獲取所述多個歷史數據的分位數;
計算單元,用于基于異常程度超參數和所述分位數,計算閾值參數。
10.一種服務器,包括:
存儲器,用于存儲計算機指令;
處理器,用于執行所述計算機指令實現以下步驟:基于時間長度超參數,獲取距離當前時刻最近的多個歷史數據;基于分位位置超參數,獲取所述多個歷史數據的分位數;基于異常程度超參數和所述分位數,計算閾值參數。
11.一種數據類型識別方法,包括:
使用異常數據識別模型,識別業務數據的數據類型;其中,所述異常數據識別模型包括閾值參數;在識別數據類型的過程中,將所述閾值參數與所述業務數據進行比較,以實現數據類型的識別。
12.如權利要求11所述的方法,所述閾值參數基于如權利要求1至8中任一項所述方法計算得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811541467.1/1.html,轉載請聲明來源鉆瓜專利網。





