[發(fā)明專利]多媒體文件推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110336117.7 | 申請(qǐng)日: | 2021-03-29 |
| 公開(kāi)(公告)號(hào): | CN113032589A | 公開(kāi)(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 查強(qiáng) | 申請(qǐng)(專利權(quán))人: | 北京奇藝世紀(jì)科技有限公司 |
| 主分類號(hào): | G06F16/435 | 分類號(hào): | G06F16/435;G06F16/48;G06F16/33 |
| 代理公司: | 北京柏杉松知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 高鶯然;馬敬 |
| 地址: | 100080 北京市海淀區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多媒體 文件 推薦 方法 裝置 電子設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明實(shí)施例提供了多媒體文件推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),涉及計(jì)算機(jī)技術(shù)領(lǐng)域,可以向用戶推薦用戶感興趣的多媒體文件。本發(fā)明實(shí)施例包括:獲取待推薦用戶的歷史訪問(wèn)記錄,歷史訪問(wèn)記錄為待推薦用戶在指定時(shí)間段內(nèi)訪問(wèn)過(guò)的多媒體文件。然后基于歷史訪問(wèn)記錄包括的多媒體文件,生成待推薦用戶的歷史訪問(wèn)標(biāo)簽集合。同時(shí)獲取每個(gè)待推薦多媒體文件的標(biāo)簽集合。再基于預(yù)設(shè)深度語(yǔ)義匹配模型,確定歷史訪問(wèn)標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量與每個(gè)待推薦多媒體文件的標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量之間的相似度。接著根據(jù)歷史訪問(wèn)標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量與每個(gè)待推薦多媒體文件的標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量之間的相似度,選擇為待推薦用戶推薦的待推薦文件。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及多媒體文件推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,用戶越來(lái)越頻繁地訪問(wèn)各種網(wǎng)站,以通過(guò)網(wǎng)站來(lái)瀏覽自己感興趣的多媒體文件。例如,用戶常常通過(guò)訪問(wèn)視頻網(wǎng)站來(lái)觀看自己喜愛(ài)的視頻。
但是,網(wǎng)站向每個(gè)用戶所推薦的內(nèi)容是一樣的。而對(duì)于不同用戶而言,每個(gè)用戶感興趣的多媒體文件是不相同的。這樣,使得網(wǎng)站所推薦的內(nèi)容無(wú)法滿足用戶的個(gè)性化需求。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供多媒體文件推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),以向用戶推薦用戶感興趣的多媒體文件,從而實(shí)現(xiàn)個(gè)性化推薦。具體技術(shù)方案如下:
第一方面,本發(fā)明實(shí)施例提供了一種多媒體文件推薦方法,可以包括:
獲取待推薦用戶的歷史訪問(wèn)記錄,所述歷史訪問(wèn)記錄為所述待推薦用戶在指定時(shí)間段內(nèi)訪問(wèn)過(guò)的多媒體文件;
基于所述歷史訪問(wèn)記錄包括的多媒體文件,生成所述待推薦用戶的歷史訪問(wèn)標(biāo)簽集合;
獲取每個(gè)待推薦多媒體文件的標(biāo)簽集合;
基于預(yù)設(shè)深度語(yǔ)義匹配模型,確定所述歷史訪問(wèn)標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量與每個(gè)待推薦多媒體文件的標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量之間的相似度;其中,所述預(yù)設(shè)深度語(yǔ)義匹配模型為基于樣本訓(xùn)練集對(duì)初始深度語(yǔ)義匹配模型訓(xùn)練得到的模型,所述樣本訓(xùn)練集包括每個(gè)樣本用戶的樣本歷史訪問(wèn)標(biāo)簽集合、正樣本標(biāo)簽集合和負(fù)樣本標(biāo)簽集合;針對(duì)每個(gè)樣本用戶,該樣本用戶的樣本歷史訪問(wèn)標(biāo)簽集合包括:該樣本用戶在歷史時(shí)間段內(nèi)訪問(wèn)過(guò)的多媒體文件對(duì)應(yīng)的標(biāo)簽;該樣本用戶的正樣本標(biāo)簽集合包括:該樣本用戶最近一次訪問(wèn)的多媒體文件對(duì)應(yīng)的標(biāo)簽;該樣本用戶的負(fù)樣本標(biāo)簽集合包括:預(yù)設(shè)數(shù)量的其他樣本用戶在所述歷史時(shí)間段內(nèi)訪問(wèn)過(guò)的多媒體文件對(duì)應(yīng)的標(biāo)簽;
根據(jù)所述歷史訪問(wèn)標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量與每個(gè)待推薦多媒體文件的標(biāo)簽集合對(duì)應(yīng)的語(yǔ)義向量之間的相似度,選擇為所述待推薦用戶推薦的待推薦文件。
在一種可能的實(shí)現(xiàn)方式中,所述預(yù)設(shè)深度語(yǔ)義匹配模型通過(guò)以下步驟訓(xùn)練獲得:
構(gòu)建所述樣本訓(xùn)練集;
將所述樣本訓(xùn)練集包括的一個(gè)樣本用戶的樣本歷史訪問(wèn)標(biāo)簽集合、正樣本標(biāo)簽集合和負(fù)樣本標(biāo)簽集合輸入所述初始深度語(yǔ)義匹配模型,獲取所述初始深度語(yǔ)義模型輸出的第一相似度和第二相似度,所述第一相似度為樣本用戶的樣本歷史訪問(wèn)標(biāo)簽集合與正樣本標(biāo)簽集合之間的語(yǔ)義相似度,所述第二相似度為樣本用戶的樣本歷史訪問(wèn)標(biāo)簽集合與負(fù)樣本標(biāo)簽之間的語(yǔ)義相似度;
基于所述第一相似度和所述第二相似度計(jì)算損失函數(shù)值,根據(jù)所述損失函數(shù)值,判斷所述初始深度語(yǔ)義匹配模型是否收斂;
如果所述初始深度語(yǔ)義匹配模型未收斂,則根據(jù)所述損失函數(shù)值調(diào)整所述初始深度語(yǔ)義匹配模型的網(wǎng)絡(luò)參數(shù),并返回將所述樣本訓(xùn)練集包括的一個(gè)樣本用戶的樣本歷史訪問(wèn)標(biāo)簽集合、正樣本標(biāo)簽集合和負(fù)樣本標(biāo)簽集合輸入所述初始深度語(yǔ)義匹配模型的步驟;
如果所述初始深度語(yǔ)義匹配模型收斂,則將當(dāng)前的初始深度語(yǔ)義匹配模型作為所述預(yù)設(shè)深度語(yǔ)義匹配模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇藝世紀(jì)科技有限公司,未經(jīng)北京奇藝世紀(jì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110336117.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





