[發明專利]一種基于梯度策略決策算法的個性化運動推薦方法在審
| 申請號: | 202110917121.2 | 申請日: | 2021-08-11 |
| 公開(公告)號: | CN113611389A | 公開(公告)日: | 2021-11-05 |
| 發明(設計)人: | 楊良懷;翁偉寧 | 申請(專利權)人: | 東南數字經濟發展研究院 |
| 主分類號: | G16H20/30 | 分類號: | G16H20/30;G06N3/08 |
| 代理公司: | 北京盛凡智榮知識產權代理有限公司 11616 | 代理人: | 葉似錦 |
| 地址: | 324000 浙江省衢州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 梯度 策略 決策 算法 個性化 運動 推薦 方法 | ||
1.一種基于梯度策略算法的個性化運動推薦方法,包括以下步驟:
(1)采集用戶運動習慣表征;
(2)構建基于強化梯度策略算法的運動習慣適配模型,主要由自訓練運動配置決策體和快速推薦算法組成,自訓練運動配置決策體根據少樣本標簽自訓練,推薦算法根據決策體進行運動習慣、強度的個性化適配。
(3)實時調整決策目標,評價決策個性化運動推薦和用戶實際運動量的適配情況,以運動實際完成量為優化目標實時更新決策結果。
(4)決策模型自適應機制,挖掘用戶運動習慣的動態變化自適應調整決策體參數,以實現決策體對用戶習慣的實時更新。
2.根據權利要求1中的基于梯度策略算法的個性化運動推薦方法,其特征在于:步驟1)所述的運動習慣表征具體包括:
(1.1)時間習慣表征;
所述的時間習慣以向量軌跡的形式表示,包括個體運動時間以及運動時間段。向量軌跡按小時區分時間段,則其根據時間先后順序形成軌跡序列其中的表示個體在該小時時間段內的平均運動時間,由公式(1)計算:
其中的m為個體習慣計算周數,以m周運動數據作為個體運動時間習慣。xi,n為第i周的第n個小時內的運動時長。m周運動數據均值時長以序列化作為時間習慣表征,軌跡可衡量運動時間習慣相似性。
(1.2)強度習慣表征;
強度習慣表征與時間習慣表征相似,其根據時間先后順序形成的軌跡序列其中的表示個體在該小時時間段內的平均運動強度,由公式(1)計算:
其中的m為個體習慣計算周數,以m周運動數據作為個體運動強度習慣。xi,n為第i周的第n個小時內的平均運動心率,平均運動心率與強度直接掛鉤,其心率越高表征個體對運動負載強烈,可直接被認為個體運動強度反映。m周運動數據均值時長以序列化作為時間習慣表征,軌跡可衡量運動強度習慣相似性。
(1.3)運動總體表征
以運動總量表征運動習慣,運動總量以限定時間內分布以向量軌跡序列表征,運動總量以運動強度與運動時間乘積計算,運動總量計算公式如下:
其中的T1:n為個體習慣運動總量表征向量,向量表示個體運動量在限定時間內的分布狀況,該習慣分布情況以軌跡形式組織,作為細粒度推薦的基準軌跡并作為決策體學習標準實現運動分布適配、推薦。
3.根據權利要求1所述的基于梯度策略算法的個性化運動推薦方法,其特征在于:步驟(2)所述的構建基于強化梯度策略算法的運動習慣適配模型具體包括:
(2.1)運動習慣適配模型總體架構,運動習慣適配模型主要分為兩個模型:自訓練運動配置模型和個性化推薦模型。
(2.2)基于梯度策略的強化決策機搭建,強化決策機學習個體運動習慣并模仿個體在運動分配中的決策思路完成運動快速適配。
(2.3)個性化運動推薦模型,個性化運動推薦模型的核心為梯度策略強化決策機,輸入為個體自訂一周訓練總量,以馬爾可夫決策過程進行決策機自采樣訓練并輸出周運動推薦表,指定每個時間段是否運動,運動強度以及運動時間。
4.根據權利要求3所述的基于梯度策略算法的個性化運動推薦方法,其特征在于:步驟(2.1)中所述的自訓練運動配置模型為決策中樞,其主要從個體運動總量習慣中學習到詳細運動決策特征,并實現在不同運動需求和不同時間內的運動個性化推薦。該模型模擬個體針對運動的思考模式并模擬其決策過程,形成自采樣和自訓練的推薦決策模型。該模式減少模型需求輸入并實現與個體運動習慣的快速適配;個性化推薦模型以決策模型為基礎,以軌跡分配的形式完成推薦運動生成。推薦模型對每個時間點實施決策,并以決策改變運動分配狀態實現后續決策。決策軌跡即為基于運動習慣的推薦運動處方。
5.根據權利要求3所述的基于梯度策略算法的個性化運動推薦方法,其特征在于:步驟(2.1)中運動習慣適配模型內核為基于梯度策略的決策機,決策機對每個細粒度狀態分析并決定其運動安排情況,決策機學習針對不同時間和需求運動量的運動安排方式,其由決策機構筑和采樣訓練兩部分組成。而個性化推薦模型針對預訓練的決策機形成一條運動適配軌跡向量,決策機在每個時間點中決定分配的運動量并完成整體軌跡配置,形成完整基于習慣的運動推薦方案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南數字經濟發展研究院,未經東南數字經濟發展研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110917121.2/1.html,轉載請聲明來源鉆瓜專利網。





