[發明專利]數據處理方法、電子設備及介質有效
| 申請號: | 202011044261.5 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112182382B | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 蔡文淵;駱瑋璐;潘翔;張坤坤 | 申請(專利權)人: | 上海嗨普智能信息科技股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06N3/04;G06N3/08;H04L29/08 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 丁慧玲 |
| 地址: | 200434 上海市虹口*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 電子設備 介質 | ||
本發明涉及一種數據處理方法、電子設備及介質,方法包括:步驟S1、獲取信息瀏覽數據;步驟S2、為數據處理模型設定模型參數的初始值;步驟S3、對信息瀏覽特征向量序列進行信息編碼處理,得到呈現中間特征序列步驟S4、對進行解碼處理,得到點擊中間特征序列基于Si獲取xj對應的預測點擊概率基于和實際點擊概率zj確定第一損失函數Lc;步驟S5、獲取預測信息推送結果概率和第二損失函數Lv;步驟S6、根據Lc和Lv判斷是否需要調整所述模型參數,若需要,則基于Lc和Lv調整所述模型參數,返回執行步驟S3,否則,執行步驟S7;步驟S7、獲取當前模型對應的A1、A2,基于A1和A2確定每一通道對應的權重。本發明能夠高效、準確地獲取到不同通道對于推送結果數據的權重。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種數據處理方法、電子設備及介質。
背景技術
數據處理領域是計算機領域的重要分支。在計算機領域中,根據呈現方式,數據可以包括文本數據、圖像數據、音頻數據、視頻數據等多種;根據存儲方式,數據可以被存儲到數據庫、文本文件、特定格式文件(例如.doc/.xls)等;根據數據形成的方式,可以包括靜態數據和動態數據,動態數據尤其是隨時間變化的數據,例如通過路由器交換機等網絡設備獲取的信息推送數據、通過GPS或北斗等采集的設備LBS數據、等。數據處理可以為“正向處理”,例如利用某種算法處理圖像,使之更清晰,也可以為“逆向處理”,例如在已知合成圖像的清楚下,通過計算機程序分離合成圖像所使用的多個原始圖像。再如,在信息推送場景中,信息通常可以通過多種通道進行推送,選擇目標通道對信息進行推送時,需要根據已有的信息推送結果數據逆向獲取到不同通道對于推送結果數據的權重,基于每一通道對于推送結果數據的權重選擇目標通道。
靜態數據的“逆向處理”相對容易。動態數據之間也會存在關聯關系,但因為動態數據多是隨時間變化的數據,需要考慮時間維度對關聯關系的影響,不僅會占用較多的計算機存儲資源、檢索資源、運算處理資源,而且處理精度也不夠理想,隨著智能化時代的到來,信息推送應用越來越廣泛,因此,如何高效準確地通過數據的“逆向處理”,獲取到不同通道對于推送結果數據的權重,成為亟待解決的技術問題。
發明內容
本發明目的在于,提供一種數據處理方法、電子設備及介質,能夠高效、準確地獲取到不同通道對于推送結果數據的權重。
根據本發明第一方面,提供了一種數據處理方法,包括:
步驟S1、從預設的數據庫中獲取n條信息瀏覽數據{G1,G2...Gn},Gi共有mi個信息瀏覽特征向量,分別為按照對應的時間戳順序排列,構成信息瀏覽特征向量序列,Xj表示Gi的第j個信息瀏覽特征向量,j=1i,2i,3i...mi,所述信息瀏覽特征向量Xj包括呈現特征向量xj和實際點擊概率zj,yi為Gi的實際信息推送結果概率;
步驟S2、為預設的數據處理模型設定模型參數的初始值,所述模型參數包括通道呈現權重向量A1、通道點擊權重向量A2、呈現中間特征向量初始值h0、點擊中間特征向量初始值s0,平衡系數λ,其中,通道呈現權重向量A1的元素用于表示信息推送通道的呈現權重,通道點擊權重向量A2的元素用于表示信息推送通道的點擊權重;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海嗨普智能信息科技股份有限公司,未經上海嗨普智能信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011044261.5/2.html,轉載請聲明來源鉆瓜專利網。





