[發明專利]一種推薦模型的訓練方法和訓練裝置在審
| 申請號: | 201710372373.5 | 申請日: | 2017-05-24 |
| 公開(公告)號: | CN107273436A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 白露;楊大利;汪鑫;郭文濤 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 中原信達知識產權代理有限責任公司11219 | 代理人: | 張一軍,姜勁 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 推薦 模型 訓練 方法 裝置 | ||
技術領域
本發明涉及計算機技術領域,特別地涉及一種推薦模型的訓練方法和訓練裝置。
背景技術
推薦是進行信息推廣以使人們獲取信息的一種重要途徑,應用在生活的各個方面,例如:搜索引擎的推薦、輸入法輸入詞的推薦、網站信息的推薦、以及朋友圈的信息推薦、商品推薦等等。通過將收集的用戶信息進行分析處理,進而生成推薦模型,可以更便捷、快速、準確地進行用戶推薦。
以搜索引擎為例,當用戶輸入一個關鍵詞時,搜索引擎即會使用根據網站記錄的其他用戶的搜索記錄訓練生產的推薦模型向該用戶進行推薦,例如:當用戶輸入關鍵詞“JAVA”時,搜索引擎的推薦結果可以包括“JAVA培訓”、“JAVA教程”、“JAVA下載”、“JAVA環境變量設置”等等內容,以便用戶進行選擇,從而節省用戶的輸入時間,提高用戶的體驗。推薦模型的推薦結果將直接影響該搜索引擎的用戶滿意度。
以電子商務行業為例,在電子商務(簡稱電商)業務系統中,向用戶推薦商品是可以促使用戶瀏覽、篩選商品的一種重要途徑。通過挖掘用戶在電商網站上的行為動作序列以獲得深層信息,推薦系統可以更精準的分析和刻畫用戶需求,從而及時的給用戶推薦感興趣的商品,并為商家帶來更多的利潤。用戶動作例如包括:搜索商品信息,打開、瀏覽或關閉某個頁面,點擊頁面某個位置,發表或轉載評論等等。
當前電商網站中使用的商品推薦系統,大多是通過對用戶在頁面上的瀏覽、搜索、點擊等行為信息進行分析后得到商品推薦方案。現有的商品推薦系統是從擴充推薦模型的訓練特征的角度入手,通過人工篩選或機器統計的方法將用戶的行為信息加工并轉化成特征表示,連同包括頁面的樣式、內容、鏈接等等在內的頁面內容、以及用戶相關的個人屬性信息(如:用戶登陸網站的時間、地域、設備號,用戶注冊時所填寫的個人信息等)等其他的數據特征,一并輸入到排序或推薦模型中,最后得到可以推薦的商品及其排序。
在實現本發明的過程中,發明人發現現有技術存在如下技術問題:
1、目前大多數推薦系統是通過將用戶行為數據作為樣本的特征輸入到推薦模型中以影響推薦結果,但是推薦結果是否為客戶所認可,以及推薦模型是否可以更為優化卻沒有具體的參考標準;
2、目前的推薦系統存在數據標注稀疏和分布不平衡等問題,例如:在推薦結果中,僅有很少量的結果被用戶所采納,相對于展現量來說,采納量很稀疏。如何有效緩解訓練數據的稀疏性和不平衡性,提升推薦系統的訓練效果,是一個亟待解決的問題。
發明內容
有鑒于此,本發明實施例提供一種推薦模型的訓練方法和訓練裝置,能夠將用戶在推薦結果展示之后的行為作為推薦反饋,進一步地用于優化推薦模型;同時可以有效緩解訓練數據中采納量相較于推薦量上的稀疏性和正負樣本比例的不平衡性。
為實現上述目的,根據本發明實施例的一個方面,提供了一種推薦模型的訓練方法。
一種推薦模型的訓練方法,包括:獲取推薦模型的訓練數據,所述訓練數據為最近時段產生的數據,所述最近時段具有預定義的時長;按照預定的訓練數據標注規則對所述訓練數據進行標注以得到最新標注數據,其中,所述最新標注數據包括所述最近時段發生的推薦結果被展示后的用戶反饋,所述用戶反饋根據推薦結果被展示后的用戶行為來確定;對所述最新標注數據進行訓練以得到推薦模型。
可選地,按照預定的訓練數據標注規則對所述訓練數據進行標注以得到最新標注數據的步驟包括:從用戶行為日志中讀取所述最近時段中所述用戶在推薦結果被展示后的用戶行為的序列;對所述序列中的每個用戶行為,根據預定義的計分規則,為所述用戶行為對應的用戶-推薦結果關系數據賦予相應的分值;使用所述分值對所述訓練數據進行標注以得到所述最新標注數據。
可選地,所述用戶行為的序列包括所述用戶訪問的推薦結果頁的標識、時間、流量來源和所述用戶在推薦結果詳情頁的動作及時間戳。
可選地,所述計分規則通過下述步驟生成:從用戶行為日志中提取所述用戶在推薦結果被展示后的用戶行為的序列;統計所述序列中的行為特征數據以生成訓練樣本集,所述行為特征數據包括用戶對各個推薦結果的行為及各個所述行為花費的時間和相互次序;根據推薦結果是否被采納來對所述訓練樣本集進行標注;對所述標注后的訓練樣本集進行訓練以得到所述計分規則。
可選地,統計所述序列中的行為特征數據包括:把所述序列按會話劃分,并統計所述會話中的行為特征數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710372373.5/2.html,轉載請聲明來源鉆瓜專利網。





