[發明專利]推薦信息穿插位置確定方法、系統、設備及存儲介質有效
| 申請號: | 202010084798.8 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111310039B | 公開(公告)日: | 2022-10-04 |
| 發明(設計)人: | 李軒增 | 申請(專利權)人: | 江蘇滿運軟件科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9538;G06N20/00 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 夏彬 |
| 地址: | 210012 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推薦 信息 穿插 位置 確定 方法 系統 設備 存儲 介質 | ||
1.一種推薦信息穿插位置確定方法,其特征在于,包括采用強化學習對穿插位置進行迭代訓練,其中,將推薦信息穿插在各個位置分別作為一個動作,并且在每一輪迭代訓練中執行如下步驟:
接收用戶的搜索條件,根據所述搜索條件生成排序列表,并獲取推薦信息;
根據當前迭代執行的動作,將推薦信息插入所述排序列表對應的穿插位置;
經過預設時間段后,統計每個動作所對應的反饋量;
根據所述反饋量計算每個動作的偏好值;
根據所述偏好值選擇執行的動作,并將選擇的動作作為下一輪迭代執行的動作。
2.根據權利要求1所述的推薦信息穿插位置確定方法,其特征在于,在第一輪迭代訓練開始時,隨機選擇當前迭代執行的動作。
3.根據權利要求1所述的推薦信息穿插位置確定方法,其特征在于,采用如下公式計算每個動作的偏好值:
Q(ai)=(Q(ai)*ts+Rt(ai))/ts
其中,Q(ai)為第i個動作的偏好值,i∈(1,n),n為動作的總數量,Rt(ai)為第i個動作的反饋量,ts為預設時間段的時間長度。
4.根據權利要求1所述的推薦信息穿插位置確定方法,其特征在于,所述根據所述反饋量計算每個動作的偏好值之后,還包括如下步驟:
統計預設時間段內每個動作所對應的執行次數;
根據每個動作所對應的執行次數對每個動作的偏好值進行修正。
5.根據權利要求4所述的推薦信息穿插位置確定方法,其特征在于,采用如下公式對每個動作的偏好值進行修正:
Q(ai)’=Q(ai)+k1*[(log(T_all)/T_ai)*k2]
其中,Q(ai)’為第i個動作的修正后偏好值,Q(ai)為第i個動作的修正前偏好值,T_all為預設時間段內所有動作的總執行次數,T_ai為預設時間段內第i個動作的執行次數,k1和k2為預設系數。
6.根據權利要求1所述的推薦信息穿插位置確定方法,其特征在于,所述根據所述偏好值選擇執行的動作之后,還包括如下步驟:
判斷當前迭代獲得的每個動作的偏好值與前一輪迭代獲得的每個動作的偏好值的差值是否均小于預設閾值;
如果是,則結束當前迭代訓練,并將選擇的動作作為實際應用中執行的動作。
7.根據權利要求1所述的推薦信息穿插位置確定方法,其特征在于,所述根據所述偏好值選擇執行的動作,包括如下步驟:
采用eposilon-greedy策略,根據所述偏好值選擇執行的動作。
8.根據權利要求1所述的推薦信息穿插位置確定方法,其特征在于,所述每個動作所對應的反饋量包括每個動作所對應的電話量、點擊量和成交量中的至少一種。
9.一種推薦信息穿插位置確定系統,其特征在于,應用于權利要求1至8中任一項所述的推薦信息穿插位置確定方法,所述系統采用強化學習對穿插位置進行迭代訓練,所述系統包括:
用戶搜索模塊,用于接收用戶的搜索條件,根據所述搜索條件生成排序列表,并獲取推薦信息;
動作執行模塊,用于對于每一輪迭代訓練,根據當前迭代執行的動作,將推薦信息插入所述排序列表對應的穿插位置;
反饋統計模塊,用于對于每一輪迭代訓練,在應用當前迭代執行的動作并經過預設時間段后,統計每個動作所對應的反饋量;
偏好計算模塊,用于對于每一輪迭代訓練,根據統計得到的反饋量計算每個動作的偏好值;
動作選擇模塊,用于對于每一輪迭代訓練,根據計算得到的偏好值選擇執行的動作,并將選擇的動作作為下一輪迭代執行的動作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇滿運軟件科技有限公司,未經江蘇滿運軟件科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010084798.8/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





