[發明專利]一種針對于預估模型的數據處理方法及裝置在審
| 申請號: | 201510564920.0 | 申請日: | 2015-09-08 |
| 公開(公告)號: | CN105224998A | 公開(公告)日: | 2016-01-06 |
| 發明(設計)人: | 馬越 | 申請(專利權)人: | 北京金山安全軟件有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q30/02 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 孫翠賢;馬敬 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 預估 模型 數據處理 方法 裝置 | ||
1.一種針對于預估模型的數據處理方法,其特征在于,包括:
獲得從用戶日志數據中提取的多個目標特征的目標特征名,其中,所述用戶日志數據為基于本次訓練所對應數據采集時間段內的用戶操作所生成的日志數據;
獲得歷史特征信息,其中,所述歷史特征信息為預先保存的且基于上一次訓練所述預估模型所得的輸出數據所生成;
對所述目標特征名和所述歷史特征信息進行累加處理,得到待利用的多組特征描述信息,其中,所述待利用的多組特征描述信息中的特征名各不相同且特征值基于所述歷史特征信息確定;
將所述待利用的多組特征描述信息作為輸入數據對所述預估模型進行訓練,得到作為輸出數據的多組特征描述信息。
2.根據權利要求1所述的方法,其特征在于,還包括:
基于作為輸出數據的多組特征描述信息,按照預定更新方式更新所述歷史特征信息;其中,所述預定更新方式包括:
分別判斷作為輸出數據的每一組特征描述信息中的特征名是否與所述歷史特征信息所包括一組特征描述信息中的特征名相同,如果相同,將所述歷史特征信息所包括該組特征描述信息中的特征值更新為作為輸出數據的該組特征描述信息中的特征值,否則,在所述歷史特征信息中增加作為輸出數據的該組特征描述信息。
3.根據權利要求1或2所述的方法,其特征在于,所述待利用的多組特征描述信息中的特征名均為目標特征名。
4.根據權利要求1或2所述的方法,其特征在于,所述待利用的多組特征描述信息中的特征名包括目標特征名和所述歷史特征信息所包括的特征描述信息中與所述目標特征名不同的特征名。
5.根據權利要求1或2所述的方法,其特征在于,待利用的任意一組的特征描述信息中特征值的確定方式,包括:
如果待利用的當前組的特征描述信息中的特征名與所述歷史特征信息所包括的一組特征描述信息中的特征名相同,則該當前組的特征描述信息中的特征值為所述歷史特征信息中該組特征描述信息中的特征值;
如果待利用的當前組的特征描述信息中的特征名與所述歷史特征信息所包括特征描述信息中的特征名均不相同,則該當前組的特征描述信息中的特征名所對應的特征值為默認值。
6.一種針對于預估模型的數據處理裝置,其特征在于,包括:
目標特征名獲得模塊,用于獲得從用戶日志數據中提取的多個目標特征的目標特征名,其中,所述用戶日志數據為基于本次訓練所對應數據采集時間段內的用戶操作所生成的日志數據;
歷史特征信息獲得模塊,用于獲得歷史特征信息,其中,所述歷史特征信息為預先保存的且基于上一次訓練所述預估模型所得的輸出數據所生成;
累加處理模塊,用于對所述目標特征名和所述歷史特征信息進行累加處理,得到待利用的多組特征描述信息,其中,所述待利用的多組特征描述信息中的特征名各不相同且特征值基于所述歷史特征信息確定;
模型訓練模塊,用于將所述待利用的多組特征描述信息作為輸入數據對所述預估模型進行訓練,得到作為輸出數據的多組特征描述信息。
7.根據權利要求6所述的裝置,其特征在于,還包括:
歷史特征信息更新模塊,用于基于作為輸出數據的多組特征描述信息,按照預定更新方式更新所述歷史特征信息;其中,所述預定更新方式包括:
分別判斷作為輸出數據的每一組特征描述信息中的特征名是否與所述歷史特征信息所包括一組特征描述信息中的特征名相同,如果相同,將所述歷史特征信息所包括該組特征描述信息中的特征值更新為作為輸出數據的該組特征描述信息中的特征值,否則,在所述歷史特征信息中增加作為輸出數據的該組特征描述信息。
8.根據權利要求6或7所述的裝置,其特征在于,所述待利用的多組特征描述信息中的特征名均為目標特征名。
9.根據權利要求6或7所述的裝置,其特征在于,所述待利用的多組特征描述信息中的特征名包括目標特征名和所述歷史特征信息所包括的特征描述信息中與所述目標特征名不同的特征名。
10.根據權利要求6或7所述的裝置,其特征在于,待利用的任意一組的特征描述信息中特征值的確定方式,包括:
如果待利用的當前組的特征描述信息中的特征名與所述歷史特征信息所包括的一組特征描述信息中的特征名相同,則該當前組的特征描述信息中的特征值為所述歷史特征信息中該組特征描述信息中的特征值;
如果待利用的當前組的特征描述信息中的特征名與所述歷史特征信息所包括特征描述信息中的特征名均不相同,則該當前組的特征描述信息中的特征名所對應的特征值為默認值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山安全軟件有限公司,未經北京金山安全軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510564920.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





