[發(fā)明專利]用戶興趣的挖掘方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010063555.6 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN113139085B | 公開(公告)日: | 2023-03-21 |
| 發(fā)明(設(shè)計)人: | 牛心怡;吳安新;王瑜 | 申請(專利權(quán))人: | 上海嗶哩嗶哩科技有限公司 |
| 主分類號: | G06F16/735 | 分類號: | G06F16/735;G06F16/78;G06F16/783;G06F40/284 |
| 代理公司: | 北京英特普羅知識產(chǎn)權(quán)代理有限公司 11015 | 代理人: | 鄧小玲;鄧應(yīng)山 |
| 地址: | 200433 上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用戶 興趣 挖掘 方法 系統(tǒng) | ||
1.一種用戶興趣的挖掘方法,其特征在于,所述方法包括:
獲取用戶在預(yù)設(shè)時間內(nèi)輸入的多種視頻操作和每種視頻操作對應(yīng)的視頻信息;
根據(jù)所述視頻信息確定所述視頻信息所屬的興趣類別;
統(tǒng)計每個用戶在每種興趣類別中執(zhí)行每種視頻操作的次數(shù)和每種視頻操作的總執(zhí)行次數(shù);
根據(jù)每個用戶在每種興趣類別中執(zhí)行每種視頻操作的次數(shù)和每種視頻操作的總執(zhí)行次數(shù),計算每個用戶在每種興趣類別的分值;
其中,所述根據(jù)每個用戶在每種興趣類別中執(zhí)行每種視頻操作的次數(shù)和每種視頻操作的總執(zhí)行次數(shù),計算每個用戶在每種興趣類別的分值,包括:
根據(jù)每種視頻操作的總執(zhí)行次數(shù)確定對應(yīng)的視頻操作的權(quán)重;
所述根據(jù)每種視頻操作的總執(zhí)行次數(shù)確定對應(yīng)的視頻操作的權(quán)重,包括:
將每種視頻操作的次數(shù)進行倒數(shù)計算,并得到每種視頻操作的倒數(shù)計算結(jié)果;
將每種視頻操作的倒數(shù)計算結(jié)果進行比例計算,以得到每種視頻操作相應(yīng)的權(quán)重;
根據(jù)每個用戶在每種興趣類別中執(zhí)行每種視頻操作的次數(shù)和所述對應(yīng)的視頻操作的權(quán)重,計算每個用戶在每種興趣類別的分值;
根據(jù)所述分值確定與所述分值對應(yīng)的用戶對應(yīng)的興趣類別。
2.如權(quán)利要求1所述的挖掘方法,其特征在于,所述根據(jù)所述視頻信息確定所述視頻信息所屬的興趣類別,包括:
將所述視頻信息進行處理,以從所述視頻信息中提取出核心詞;
將所述核心詞與預(yù)設(shè)的多個興趣類別中的預(yù)設(shè)核心詞進行相似度計算,以根據(jù)計算結(jié)果確定所述視頻信息所屬的興趣類別。
3.如權(quán)利要求2所述的挖掘方法,其特征在于,所述將所述視頻信息進行處理,以從所述視頻信息中提取出核心詞,包括:
將所述視頻信息進行分詞處理以得到分詞結(jié)果;
將所述分詞結(jié)果進行詞義識別,以篩選出具有詞義的關(guān)鍵詞;
將所述關(guān)鍵詞與預(yù)設(shè)詞庫中的詞語進行匹配;
當(dāng)匹配成功時,則確定所述關(guān)鍵詞為所述核心詞。
4.如權(quán)利要求2所述的挖掘方法,其特征在于,所述將所述核心詞與預(yù)設(shè)的多個興趣類別中的預(yù)設(shè)核心詞進行相似度計算,以根據(jù)計算結(jié)果確定所述視頻信息所屬的興趣類別,包括:
將所述核心詞與所述預(yù)設(shè)核心詞分別進行詞向量處理,以得到與所述核心詞對應(yīng)的第一詞向量和與所述預(yù)設(shè)核心詞對應(yīng)的第二詞向量;
利用余弦相似度算法計算所述第一詞向量和所述第二詞向量的相似度;
當(dāng)所述相似度高于預(yù)設(shè)相似度時,則確定所述視頻信息屬于所述預(yù)設(shè)核心詞對應(yīng)的目標興趣類別,并將所述核心詞加入至所述預(yù)設(shè)詞庫中。
5.如權(quán)利要求1所述的挖掘方法,其特征在于,每個所述用戶在每種興趣類別的分值計算公式為:
其中,j表示第j種興趣類別,Cj表示每個用戶在所述第j種興趣類別的分值,N表示視頻操作種數(shù),i表示第i種視頻操作,ki,j表示每個用戶執(zhí)行所述第j種興趣類別中所述第i種視頻操作的次數(shù),wi表示所述第i種視頻操作的權(quán)重。
6.如權(quán)利要求1或5所述的挖掘方法,其特征在于,所述根據(jù)所述分值確定與所述分值對應(yīng)的用戶對應(yīng)的興趣類別,包括:
將所述分值分別與多個興趣類別的預(yù)設(shè)分值進行比較;
當(dāng)所述分值高于所述預(yù)設(shè)分值時,則確定所述用戶為與所述預(yù)設(shè)分值對應(yīng)的興趣類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海嗶哩嗶哩科技有限公司,未經(jīng)上海嗶哩嗶哩科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010063555.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





