[發明專利]一種搭建個性化推薦引擎的人工智能算法模型有效
| 申請號: | 201710393578.1 | 申請日: | 2017-05-27 |
| 公開(公告)號: | CN107203628B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 李華煜;梁麗麗;譚榮棉 | 申請(專利權)人: | 廣州舜飛信息科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F17/18;G06Q30/02 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 譚英強 |
| 地址: | 510665 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搭建 個性化 推薦 引擎 人工智能 算法 模型 | ||
1.一種搭建個性化推薦引擎的人工智能算法模型,其特征在于,所述搭建個性化推薦引擎的人工智能算法模型的邏輯回歸通過線性加權和sigmoid變換預估目標事件的發生概率,包括以下步驟:
1)特征的聚合方式
特征聚合的方法為基于絕對值的聚合的方法,通過設定絕對值區間,根據點擊率或注冊率把特征聚合到相應的區間;考慮到特征的點擊率或注冊率的分布,設定在較小值區域;考慮對點擊率或者注冊率作指數變換也能達到“在值較小的區域,劃分區間也較小”的效果,指數變換描述如下:
xi是特征i的點擊率或者注冊率,設定y_i為排序比率,yi是變換結果,考慮基于排序的方法,計算α*的值:
對變換后yi進行整數化,實現特征聚合:
由于α*是基于排序估計出來的,yi在[0,1]之間的分布較為均勻,因此m的設定也和聚合后的特征數也比較接近;設定點擊率模型的m=1000,注冊率模型的m=500;
2)代碼流程
get_alpha.py
計算和測試指數變換參數α*,輸入:行分割的0~1之間的浮點數,輸出:輸入數據經過指數變換后在100個分桶的計數分布,以及α*值,
ctr_feature_stat.sh
修改analysis_cross_features任務使用腳本為analysis_cross_features_alpha.py或analysis_cross_features_share_param.py,以及analysis_ctr.10008.confrun_all.sh或run_rgr_all.sh
指定online標志位即進行模型增量更新:
ctr_features_stat.sh讀入配置文件CTR_ONLINE_FEATURES指定的增量訓練數據,并生成新的mappingtablecal_features.sh讀入上述的增量訓練數據,并生成增量訓練樣本;
train_model.local.sh讀入增量訓練樣本和目前的模型參數,并作增量訓練,生成新的ctrmappingtable,所述的搭建個性化推薦引擎的人工智能算法模型的線上樣品特征缺失的處理方式,包括以下幾種:
解決方案1:最初使用的方案,通過復制樣品,然后將所有缺省的特征值設為-1,來作為沒有特征值時該特征的特征值參數;
解決方案2:在初始化模型時,將模型的常數項直接取對應樣品統計平均值的參數,使得模型的基準值變為更合理的統計平均值的參數,這樣在缺失特征時,模型也就是回歸到統計平均值;
解決方案3:使用解決方案2確定常數項,同時復制樣品并且隨機拋棄特征或者使用解決方案1中將未采集特征值的特征的特征值均設為-1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州舜飛信息科技有限公司,未經廣州舜飛信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710393578.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種待定行程車票的訂購乘車方法和系統
- 下一篇:一種FXR激動劑





