[發明專利]數據處理方法及其設備有效
| 申請號: | 201611140090.X | 申請日: | 2016-12-12 |
| 公開(公告)號: | CN107016028B | 公開(公告)日: | 2020-07-14 |
| 發明(設計)人: | 吳婭 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/27;G06F16/215 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 黃熊 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 及其 設備 | ||
公開了一種數據處理方法及其設備,所述方法包括:從源數據集中提取與算法對應的訓練數據集;通過所述算法對訓練數據集進行處理,生成結果數據集;根據反饋信息對結果數據集打標簽,生成打標數據集;將打標數據集按照源數據集的存儲方式存儲為驗證數據集。所述方法通過利用反饋信息對結果數據集進行打標簽并將打標數據集作為驗證數據集對算法進行迭代訓練,從而能夠對算法進行優化,提高算法的性能。
技術領域
本申請涉及計算機軟件技術領域,特別涉及一種數據處理方法及其設備。
背景技術
目前,隨著互聯網的快速發展,各種形式的在線交易不斷涌現。為了安全、預測等各種目的,可通過歷史交易數據和預定訓練模型對交易數據進行處理,基于處理結果對相應算法進行驗證。例如,可通過交易數據的異常告警算法對交易數據進行實時監控并基于監控結果生成告警數據,隨后,根據商家反饋或數據跟蹤,對相應告警數據進行打標簽(簡稱“打標”),若告警正確,則打標為“+”,若告警錯誤,則打標為“—”,然后對交易數據進行打標。
由此可以看出,現有方法中并未對打標后的數據進行利用和管理。
發明內容
本發明的主要目的在于提供一種,旨在解決以上提到的問題。
本申請實施例提供一種數據處理方法,所述方法包括:從源數據集中提取與算法對應的訓練數據集;通過所述算法對訓練數據集進行處理,生成結果數據集;根據反饋信息對結果數據集打標簽,生成打標數據集;將打標數據集按照源數據集的存儲方式存儲為驗證數據集。
本申請另一實施例提供一種數據處理設備,所述設備包括:提取模塊,從源數據集中提取與算法對應的訓練數據集;第一生成模塊,通過所述算法對訓練數據集進行處理,生成結果數據集;第二生成模塊,根據反饋信息對結果數據集打標簽,生成打標數據集;存儲模塊,將打標數據集按照源數據集的存儲方式存儲為驗證數據集。
本申請實施例采用的上述至少一個技術方案通過利用反饋信息對結果數據集進行打標簽并將打標數據集作為驗證數據集對算法進行迭代訓練,從而能夠對算法進行優化,提高算法的性能。
附圖說明
此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
圖1示出根據本發明的示例性實施例的數據處理方法的流程圖;
圖2示出根據本發明的另一示例性實施例的數據處理方法的流程圖;
圖3示出在監控平臺下利用根據本發明的數據處理方法的監控系統的框架圖;
圖4示出根據本發明的示例性實施例的數據處理設備的框圖。
具體實施方式
為使本申請的目的、技術方案和優點更加清楚,下面將結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
下面將參照圖1詳細說明根據本發明的算法評價方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611140090.X/2.html,轉載請聲明來源鉆瓜專利網。





