[發明專利]數據處理方法和裝置有效
| 申請號: | 201410779228.5 | 申請日: | 2014-12-15 |
| 公開(公告)號: | CN104462443B | 公開(公告)日: | 2018-02-02 |
| 發明(設計)人: | 何愷鐸 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 吳貴明,張永明 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 | ||
技術領域
本發明涉及數據處理領域,具體而言,涉及一種數據處理方法和裝置。
背景技術
目前,歸因模型已成為高級網站分析中的重要內容。主流的歸因模型有First Click、Last Click、Average Click等,這些歸因模型的建模思路是基于基礎數據(如PV,轉化等)按用戶長期訪問發生的行為通過某種計算方法進行貢獻分配,以得出客觀合理的渠道貢獻。
其中,PV為Page View,即頁面瀏覽量,是評價網站流量最常用的指標之一。
現有技術在實現歸因模型時,需要針對每一種模型設計并實現計算方法,并將所有歷史數據使用此計算方法進行運行,得出結果后將其輸出至數據庫以供查詢。在歸因計算過程中,一般需要回溯用戶的整個生命周期,因此歸因計算是計算密集型的應用。
由于現有的歸因模型往往邏輯比較簡單(如First Click將貢獻100%分配至用戶的第一次訪問),不能夠適應復雜的客戶需求。若按照特定的客戶需求(如,已有較為簡單的歸因模型的計算結果,但是客戶要求得到與現有計算結果相關的其他計算結果)增添一套全新的歸因模型,則需要重新回溯用戶的整個生命周期,以實現該歸因計算邏輯并對數據重新進行歸因計算,需要較大的開發成本并增加了系統運行負擔。此外,當歸因計算邏輯或權重參數需要有所修改時,此歸因模型亦需要重新修改和計算,計算所需時間長。
針對現有技術中生成新的歸因模型需重新實現所有數據的計算邏輯,導致開發成本高的問題,目前尚未提出有效的解決方案。
發明內容
本發明的主要目的在于提供一種數據處理方法和裝置,以解決現有技術中生成新的歸因模型需重新實現所有數據的計算邏輯,導致開發成本高的問題。
為了實現上述目的,根據本發明實施例的一個方面,提供了一種數據處理方法。
根據本發明的數據處理方法包括:獲取查詢第一參數的查詢請求和預先保存的參數集合;讀取參數集合中預存的與第一參數存在關聯關系的多個第二參數、及多個第二參數與第一參數的第一關系式;從數據庫中查詢各個第二參數的第二參數值;使用第一關系式對多個第二參數的第二參數值進行計算,得到第一參數的第一參數值。
進一步地,在從數據庫中查詢各個第二參數的第二參數值之后,數據處理方法還包括:將第二參數值按照查詢請求中的查詢維度合并得到數據表,其中,查詢維度為第一參數的屬性。
進一步地,使用第一關系式對多個第二參數的第二參數值進行計算,得到第一參數的第一參數值包括:從數據表中查詢各個查詢維度的第二參數值;按照查詢維度計算第二參數值對應第一關系式的值,得到多個第一參數值。
進一步地,讀取參數集合中預存的與第一參數存在關聯關系的多個第二參數、及多個第二參數與第一參數的第一關系式包括:讀取與第一參數存在關聯關系的多個第二參數;基于關聯關系確定多個第二參數之間的算術關系;保存關聯關系和算術關系生成第一關系式。
進一步地,使用第一關系式對多個第二參數的第二參數值進行計算,得到第一參數的第一參數值包括:解析第一關系式得到第二關系式,其中,第二關系式包括各個第二參數值的第一節點和第一參數值的第二節點,各個第一節點之間具有算術關系,第二節點與各個第一節點之間具有關聯關系;將各個第二參數值輸入至對應的第一節點;計算第二參數值對應算術關系的值,得到第二節點的第一參數值。
為了實現上述目的,根據本發明實施例的另一方面,提供了一種數據處理裝置。
根據本發明的數據處理裝置包括:獲取模塊,用于獲取查詢第一參數的查詢請求和預先保存的參數集合;讀取模塊,用于讀取參數集合中預存的與第一參數存在關聯關系的多個第二參數、及多個第二參數與第一參數的第一關系式;查詢模塊,用于從數據庫中查詢各個第二參數的第二參數值;計算模塊,用于使用第一關系式對多個第二參數的第二參數值進行計算,得到第一參數的第一參數值。
進一步地,數據處理裝置還包括:合并模塊,用于在從數據庫中查詢各個第二參數的第二參數值之后,將第二參數值按照查詢請求中的查詢維度合并得到數據表,其中,查詢維度為第一參數的屬性。
進一步地,計算模塊包括:查詢子模塊,用于從數據表中查詢各個查詢維度的第二參數值;第一計算子模塊,用于按照查詢維度計算第二參數值對應第一關系式的值,得到多個第一參數值。
進一步地,讀取模塊包括:讀取子模塊,用于讀取與第一參數存在關聯關系的多個第二參數;確定模塊,用于基于關聯關系確定多個第二參數之間的算術關系;保存模塊,用于保存關聯關系和算術關系生成第一關系式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410779228.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:密閉艙的真空度調控系統
- 下一篇:多路數據采集器





