[發(fā)明專利]對象的推薦方法、裝置、計算設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010085208.3 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111339240A | 公開(公告)日: | 2020-06-26 |
| 發(fā)明(設(shè)計)人: | 邱學(xué)忠;孔東營;舒承椿 | 申請(專利權(quán))人: | 北京達(dá)佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/9535;G06K9/62;G06Q30/02 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 王英 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對象 推薦 方法 裝置 計算 設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種對象的推薦方法、裝置、計算設(shè)備和存儲介質(zhì)。該方法包括:獲取用戶信息;從用戶特征庫中,獲取與所述用戶信息對應(yīng)的多個用戶特征向量;將所述多個用戶特征向量組成檢索向量;從索引文件中查找與所述檢索向量匹配的至少一個索引向量;將匹配到的索引向量對應(yīng)的推薦對象推送至所述用戶信息對應(yīng)的客戶端;其中,在訓(xùn)練各雙塔模型時,采用的度量函數(shù)的自變量為訓(xùn)練樣本的索引向量和檢索向量,因變量為用于表示用戶針對推送的推薦對象產(chǎn)生交互行為的概率。由此,通過使用合理設(shè)計的度量函數(shù)訓(xùn)練雙塔模型,使得基于該雙塔模型得到的多個向量能夠拼接并進(jìn)行一次檢索,以避免多次檢索召回存在的損失。
技術(shù)領(lǐng)域
本申請涉及推薦技術(shù)領(lǐng)域,特別涉及一種對象的推薦方法、裝置、計算設(shè)備和存儲介質(zhì)。
背景技術(shù)
深度學(xué)習(xí)技術(shù)的發(fā)展,正推動各個行業(yè)發(fā)生深刻的變革,深度學(xué)習(xí)應(yīng)用到數(shù)字廣告檢索系統(tǒng)中的主要方式在于對用戶行為的預(yù)估。在大規(guī)模數(shù)字廣告系統(tǒng)中,每一個流量下可以選擇投放的廣告的數(shù)量巨大,不可能一次計算選出最合適的廣告,因此一般采用多級漏斗的方式選擇出最適合的廣告,比如經(jīng)過召回、粗選和精選三個主要階段,最終使得用戶、廣告商和平臺的利益最大化,實(shí)現(xiàn)互利共贏。
然而,在召回階段,候選的廣告數(shù)量巨大,通過多級漏斗的方式預(yù)估召回時,由于預(yù)測目標(biāo)的偏差,每一次的預(yù)估召回都會存在一定的損失,在粗選和精選階段后,損失更大,難以保障檢索系統(tǒng)的精度。
因此,如何獲得更高的檢索精度并減少甚至避免召回?fù)p失,成為亟需解決的技術(shù)問題之一。
發(fā)明內(nèi)容
本申請的目的是提供一種對象的推薦方法、裝置、計算設(shè)備和存儲介質(zhì),通過使用合理設(shè)計的度量函數(shù)訓(xùn)練雙塔模型,以使得基于該雙塔模型得到的用戶向量和對象向量能夠進(jìn)行一次檢索召回,避免多次檢索召回存在的損失。
第一方面,本申請實(shí)施例提供了一種對象的推薦方法,包括:
獲取用戶信息;
從用戶特征庫中,獲取與所述用戶信息對應(yīng)的多個用戶特征向量,各用戶特征向量是基于相應(yīng)的雙塔模型對所述用戶信息進(jìn)行編碼后存儲到所述用戶特征庫中的,且各雙塔模型還用于對推薦對象進(jìn)行編碼得到各推薦對象的對象特征向量;
將所述多個用戶特征向量組成檢索向量;
從索引文件中查找與所述檢索向量匹配的至少一個索引向量,每個索引向量由同一推薦對象的多個對象特征向量組成,所述索引文件是基于各推薦對象的索引向量的向量距離得到的;
將匹配到的索引向量對應(yīng)的推薦對象推送至所述用戶信息對應(yīng)的客戶端;
其中,在訓(xùn)練各雙塔模型時,采用的度量函數(shù)的自變量為訓(xùn)練樣本的索引向量和檢索向量,因變量為用于表示用戶針對推送的推薦對象產(chǎn)生交互行為的概率。
在一個實(shí)施例中,將所述多個用戶特征向量組成檢索向量,包括:
將所述多個用戶特征向量首尾依序拼接,得到的一維向量作為所述檢索向量。
在一個實(shí)施例中,所述索引文件是基于各推薦對象的索引向量的向量距離以及分層可導(dǎo)航小世界圖算法得到的。
在一個實(shí)施例中,所述索引文件是各推薦對象的索引向量所構(gòu)建的索引結(jié)構(gòu)得到的存儲文件,構(gòu)建索引結(jié)構(gòu),包括:
以各推薦對象對應(yīng)的索引向量作為構(gòu)建所述索引結(jié)構(gòu)的元素,構(gòu)建向量集合;
選取所述向量集合的第一個元素插入所述索引結(jié)構(gòu),作為初始節(jié)點(diǎn);
遍歷所述向量集合,通過向量距離,查找所述初始節(jié)點(diǎn)的近鄰節(jié)點(diǎn),并將所述近鄰節(jié)點(diǎn)插入所述索引結(jié)構(gòu);并,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達(dá)佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達(dá)佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010085208.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





