[發(fā)明專利]超參數(shù)學(xué)習(xí)、智能推薦、關(guān)鍵詞和多媒體推薦方法及裝置在審
| 申請?zhí)枺?/td> | 202011060539.8 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN114329167A | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計)人: | 劉家豪;彭藝;謝淼;肖非 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/435;G06N20/00;G06Q30/06 |
| 代理公司: | 北京思格頌知識產(chǎn)權(quán)代理有限公司 11635 | 代理人: | 潘珺 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 參數(shù) 學(xué)習(xí) 智能 推薦 關(guān)鍵詞 多媒體 方法 裝置 | ||
本發(fā)明公開了一種超參數(shù)的學(xué)習(xí)、智能推薦、關(guān)鍵詞推薦方法及裝置。所述機器學(xué)習(xí)模型超參數(shù)的學(xué)習(xí)方法包括:獲取機器學(xué)習(xí)模型的用戶反饋行為數(shù)據(jù);根據(jù)所述用戶行為反饋數(shù)據(jù),從預(yù)設(shè)的超參數(shù)連續(xù)區(qū)間中,確定所述機器學(xué)習(xí)模型的超參數(shù)組合所在的最優(yōu)超參數(shù)子區(qū)間;在所述最優(yōu)超參數(shù)子區(qū)間中,選取出最優(yōu)超參數(shù)組合作為所述機器學(xué)習(xí)模型的超參數(shù)組合。本發(fā)明實現(xiàn)了對推薦系統(tǒng)的超參數(shù)組合的自主學(xué)習(xí),使得推薦系統(tǒng)能夠?qū)崟r地追蹤用戶的需求和興趣,從而保證了推薦系統(tǒng)具有較好的推薦效果。
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習(xí)技術(shù)領(lǐng)域,特別涉及一種超參數(shù)的學(xué)習(xí)、智能推薦、 關(guān)鍵詞和多媒體推薦方法及裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,尤其是移動互聯(lián)網(wǎng)的發(fā)展,基于各種場景下的推 薦系統(tǒng)發(fā)揮著越來越重要的作用。
近年來,推薦系統(tǒng)的核心所要解決的問題在于,如何實時準確地捕獲用戶 個性化興趣從而實現(xiàn)精準的推薦服務(wù),例如基于用戶的偏好,向用戶推薦他/她 可能感興趣的商品、多媒體、廣告和產(chǎn)品功能等等。
為了解決個性化推薦的問題,推薦系統(tǒng)往往會采用機器學(xué)習(xí)算法來刻畫用 戶的興趣愛好,例如各種線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型等等。而刻畫這些模型 本身屬性的超參數(shù),往往在學(xué)習(xí)過程之前由系統(tǒng)構(gòu)建者人為指定,這種方式會 加大模型構(gòu)建者的工作量,更重要的是,僅僅依靠人為自行設(shè)定模型超參數(shù)的 方式,如果這種超參數(shù)設(shè)置不合理,會導(dǎo)致推薦模型本身的不合理,推薦系統(tǒng) 自然也就無法達到較優(yōu)的推薦效果。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地 解決上述問題的一種超參數(shù)的學(xué)習(xí)、智能推薦、關(guān)鍵詞推薦方法及裝置。
第一方面,本發(fā)明實施例提供一種機器學(xué)習(xí)模型超參數(shù)的學(xué)習(xí)方法,包括:
獲取機器學(xué)習(xí)模型的用戶反饋行為數(shù)據(jù);
根據(jù)所述用戶行為反饋數(shù)據(jù),從預(yù)設(shè)的超參數(shù)連續(xù)區(qū)間中,確定所述機器 學(xué)習(xí)模型的超參數(shù)組合所在的最優(yōu)超參數(shù)子區(qū)間;
在所述最優(yōu)超參數(shù)子區(qū)間中,選取出最優(yōu)超參數(shù)組合作為所述機器學(xué)習(xí)模 型的超參數(shù)組合。
在一個實施例中,根據(jù)所述用戶反饋行為數(shù)據(jù),確定超參數(shù)組合所在的最 優(yōu)超參數(shù)子區(qū)間,包括:
將用戶反饋行為數(shù)據(jù)輸入所述機器學(xué)習(xí)模型;
利用所述用戶反饋行為數(shù)據(jù),遍歷預(yù)設(shè)的所述連續(xù)區(qū)間中范圍逐步縮小的 子區(qū)間,直至確定出所述機器學(xué)習(xí)模型的超參數(shù)組合所在的最優(yōu)超參數(shù)子區(qū)間。
在一個實施例中,預(yù)設(shè)的超參數(shù)連續(xù)區(qū)間采用樹結(jié)構(gòu);所述樹結(jié)構(gòu)的根節(jié) 點為所述連續(xù)區(qū)間,且孩子節(jié)點為父節(jié)點對應(yīng)區(qū)間的子區(qū)間;
利用所述用戶反饋行為數(shù)據(jù),遍歷預(yù)設(shè)的所述連續(xù)區(qū)間中范圍逐步縮小的 子區(qū)間,直至確定出所述機器學(xué)習(xí)模型的超參數(shù)組合所在的最優(yōu)超參數(shù)子區(qū)間, 具體包括:
對于樹結(jié)構(gòu)中的各個節(jié)點,從根節(jié)點開始,利用所述用戶反饋行為數(shù)據(jù), 對同層的每個節(jié)點的收益預(yù)估值進行評估,并根據(jù)評估結(jié)果,選擇將遍歷的下 一個節(jié)點,重復(fù)上述步驟,直至到達葉子節(jié)點;
將所述葉子節(jié)點作為所述機器學(xué)習(xí)模型的超參數(shù)組合所在的最優(yōu)超參數(shù)子 區(qū)間。
在一個實施例中,在所述最優(yōu)超參數(shù)子區(qū)間中,選取出最優(yōu)超參數(shù)組合之 后,還包括:
在所述樹結(jié)構(gòu)中,根據(jù)所述葉子節(jié)點對應(yīng)子區(qū)間的開始端和結(jié)束端以及所 述最優(yōu)超參數(shù)組合,將所述葉子節(jié)點分裂為至少兩個子節(jié)點;
從分裂后得到的子節(jié)點開始,回溯遍歷整個樹結(jié)構(gòu),更新每個節(jié)點對應(yīng)的 子區(qū)間的收益預(yù)估值。
在一個實施例中,在所述最優(yōu)超參數(shù)子區(qū)間中,選取出最優(yōu)超參數(shù)組合, 具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011060539.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





