[發明專利]基于跨平臺異構數據及行為上下文的CTR預估方法及系統在審
| 申請號: | 202011545280.6 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112559877A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 高茜;李繼鵬 | 申請(專利權)人: | 齊魯工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T3/40 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 250353 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 平臺 數據 行為 上下文 ctr 預估 方法 系統 | ||
本發明公開了一種基于跨平臺異構數據及行為上下文的CTR預估方法及系統,屬于大數據及自然語言處理領域,本發明要解決的技術問題為如何對用戶興趣進行深度挖掘,提高點擊率預估精度,技術方案為:數據采集及預處理:采集不同平臺的異構數據,對用戶跨平臺異構數據進行數據預處理;預估用戶實時興趣:通過注意力機制將跨平臺異構數據進行融入,即將用戶行為通過注意力機制與當下行為聯系起來,更好的預估用戶的實時興趣;提取圖片特征:通過殘差網絡對待推薦物品進行圖片特征提取,再將所有特征向量進行拼接;獲取CTR精準預估結果:將拼接后的圖片特征向量作為MLP網絡的輸入,通過MLP網絡進行高階特征提取和最終結果的預估,得到物品CTR的精確預估。
技術領域
本發明涉及大數據及自然語言處理領域,具體地說是一種基于跨平臺異構數據及行為上下文的CTR預估方法及系統。
背景技術
點擊率(Click-through Rate,CTR)是指某一內容被點擊次數與被展示次數的比例,一般用于描述內容被用戶點擊的概率。CTR預估,是指通過一系列相關數據與技術去預測特定場景下物品或內容被用戶點擊的概率。
在內容推薦和在線廣告領域,由于預估的CTR可以很好地反映特定場景下用戶對內容的偏好程度,進而根據預估CTR的大小對推薦內容進行合理的排序、截斷,形成更符合用戶偏好和行為習慣的推薦列表,最終達到提高用戶對應用的喜愛程度、使用時長或者提高應用內廣告的變現效率等目的。因此,如何提高CTR預估的準確性已經成為各大企業在內容推薦、在線廣告等領域最為核心及關鍵的研究課題。
鑒于CTR預估在內容推薦、在線廣告等互聯網應用領域的獨特地位,越來越多的企業投入大量的人力物力在CTR預估模型的研究上。目前在計算機視覺、自然語言處理領域不斷發展的深度學習技術,憑借其在大數據集下良好的并行處理能力和對高階復雜特征的高效挖掘、抽象能力,也逐步成為CTR預估模型領域的熱門研究內容。故如何對用戶興趣進行深度挖掘,提高點擊率預估精度是目前現有技術中亟待解決的問題。
發明內容
本發明的技術任務是提供一種基于跨平臺異構數據及行為上下文的CTR預估方法及系統,來解決如何對用戶興趣進行深度挖掘,提高點擊率預估精度的問題。
本發明的技術任務是按以下方式實現的,一種基于跨平臺異構數據及行為上下文的CTR預估方法,該方法具體如下:
數據采集及預處理:采集不同平臺的異構數據,對用戶跨平臺異構數據進行數據預處理;
預估用戶實時興趣:通過注意力機制將跨平臺異構數據進行融入,即將用戶行為通過注意力機制與當下行為聯系起來,更好的預估用戶的實時興趣,從而提高CTR預估的準確性;
提取圖片特征:通過殘差網絡(ResNet)對待推薦物品進行圖片特征提取,再將所有特征向量進行拼接;
獲取CTR精準預估結果:將拼接后的圖片特征向量作為MLP網絡(多層全連接網絡)的輸入,通過MLP網絡進行高階特征提取和最終結果的預估,優勢互補,得到物品CTR的精確預估。
作為優選,數據采集及預處理具體如下:
構建基本特征:根據硬件設備或手機APP獲取到的基本上下文信息及用戶信息構建離散特征和連續性數據特征;
特征轉化:通過Embedding層將采集到的用戶離散特征轉變為低維實數向量,緩解稀疏性;具體如下:
對于任意一個特征featurei,Embedding層通過不斷訓練更新為featurei的所有可能取值建立一個稠密向量映射表ei,具體如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于齊魯工業大學,未經齊魯工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011545280.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





