[發(fā)明專利]一種基于影片劇情信息的相似度計算方法在審
| 申請?zhí)枺?/td> | 201710756859.9 | 申請日: | 2017-08-29 |
| 公開(公告)號: | CN107506456A | 公開(公告)日: | 2017-12-22 |
| 發(fā)明(設(shè)計)人: | 馮方方;孫健;劉斌;付強(qiáng) | 申請(專利權(quán))人: | 環(huán)球智達(dá)科技(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京慧誠智道知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)11539 | 代理人: | 李楠 |
| 地址: | 100043 北京市石景*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 影片 劇情 信息 相似 計算方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及視頻技術(shù)領(lǐng)域,尤其涉及一種基于影片劇情信息的相似度計算方法。
背景技術(shù)
在用戶通過視頻網(wǎng)站觀看視頻時,視頻網(wǎng)站通常會向用戶推薦與用戶當(dāng)前觀看的視頻相關(guān)的視頻。例如,當(dāng)用戶以非全屏模式觀看視頻時,可以在視頻播放窗口的右側(cè)和/或下側(cè)顯示與用戶當(dāng)前觀看的視頻相關(guān)的視頻的信息。視頻推薦效果的好壞主要根據(jù)點擊率的高低來評判,通常,點擊率越高,則視頻推薦效果越好。
視頻推薦是基于影片相似度,目前計算影片相似度的主要方法為基于物品的協(xié)同過濾算法,或基于影片類型、影人、地域等屬性的算法。協(xié)同過濾推薦是在信息過濾和信息系統(tǒng)中正迅速成為一項很受歡迎的技術(shù)。與傳統(tǒng)的基于內(nèi)容過濾直接分析內(nèi)容進(jìn)行推薦不同,協(xié)同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,形成系統(tǒng)對該指定用戶對此信息的喜好程度預(yù)測。
但是,基于協(xié)同過濾算法存在無法處理冷啟動的問題,基于影片相關(guān)屬性的算法存在顆粒度比較粗的不足,從而導(dǎo)致相似度計算不準(zhǔn)確,進(jìn)而導(dǎo)致推薦效果不理想。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)的缺陷,提供一種基于影片劇情信息的相似度計算方法,基于影片劇情信息中的關(guān)鍵詞信息準(zhǔn)確計算影片的相似度,并且根據(jù)排序結(jié)果對影片進(jìn)行推薦,從而提高推薦效果。
有鑒于此,本發(fā)明實施例提供了一種基于影片劇情信息的相似度計算方法,包括:
服務(wù)器在影片數(shù)據(jù)庫中獲取影片劇情信息;其中,所述影片數(shù)據(jù)庫中包括多個影片ID和相對應(yīng)的影片劇情信息;
對所述劇情信息進(jìn)行分詞,得到影片ID對應(yīng)的多個分詞信息;
在所述分詞信息中提取預(yù)設(shè)數(shù)量的關(guān)鍵詞信息;
統(tǒng)計所述影片劇情信息中每個關(guān)鍵詞信息的出現(xiàn)次數(shù);
選取所述出現(xiàn)次數(shù)大于預(yù)設(shè)次數(shù)的關(guān)鍵詞信息;
建立所述影片ID和所述關(guān)鍵詞信息之間的關(guān)聯(lián)關(guān)系,并儲存;
基于所述關(guān)鍵詞信息根據(jù)預(yù)設(shè)規(guī)則計算影片相似度;
對所述影片相似度進(jìn)行排序,根據(jù)排序結(jié)果得到推薦影片;
建立影片ID和所述推薦影片ID之間的關(guān)聯(lián)關(guān)系,并儲存。
進(jìn)一步優(yōu)選的,在根據(jù)排序結(jié)果得到推薦影片之后,所述方法還包括:
所述服務(wù)器接收用戶終端發(fā)送的選擇指令;其中,所述選擇指令中包括目標(biāo)影片ID;
根據(jù)所述目標(biāo)影片ID獲取相關(guān)聯(lián)的所述推薦影片ID;
根據(jù)所述目標(biāo)影片ID獲取目標(biāo)影片數(shù)據(jù),并且根據(jù)所述推薦影片ID獲取影片數(shù)據(jù);
根據(jù)所述目標(biāo)影片數(shù)據(jù)和推薦影片數(shù)據(jù)生成影片顯示數(shù)據(jù),發(fā)送給所述用戶終端。
進(jìn)一步優(yōu)選的,所述預(yù)設(shè)規(guī)則為:s=2n/(a+b);
其中,s為相似度,a為第一影片相對應(yīng)的關(guān)鍵詞數(shù)量,b為第二影片相對應(yīng)的關(guān)鍵詞數(shù)量,n為所述第一影片和所述第二影片相同關(guān)鍵詞的數(shù)量。
進(jìn)一步優(yōu)選的,所述預(yù)設(shè)規(guī)則為:s=(n*n)/(a*b);
其中,s為相似度,a為第一影片相對應(yīng)的關(guān)鍵詞數(shù)量,b為第二影片相對應(yīng)的關(guān)鍵詞數(shù)量,n為所述第一影片和所述第二影片相同關(guān)鍵詞的數(shù)量。
進(jìn)一步優(yōu)選的,所述根據(jù)排序結(jié)果得到推薦影片具體為:
選擇預(yù)設(shè)排名的影片為推薦影片。
進(jìn)一步優(yōu)選的,所述預(yù)設(shè)數(shù)量不大于20個。
進(jìn)一步優(yōu)選的,預(yù)設(shè)次數(shù)為5次。
本發(fā)明實施例提供的一種基于影片劇情信息的相似度計算方法,基于影片劇情信息中的關(guān)鍵詞信息準(zhǔn)確計算影片的相似度,并且根據(jù)排序結(jié)果對影片進(jìn)行推薦,從而提高推薦效果。
附圖說明
圖1為本發(fā)明實施例提供的基于影片劇情信息的相似度計算方法流程圖;
圖2為本發(fā)明實施例提供的影片推薦方法流程圖。
具體實施方式
下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
本發(fā)明實施例提供的基于影片劇情信息的相似度計算方法,執(zhí)行主體為服務(wù)器,基于影片劇情信息中的關(guān)鍵詞計算影片相似度,根據(jù)相似度向用戶推薦影片。
圖1為本發(fā)明實施例提供的基于影片劇情信息的相似度計算方法流程圖,如圖1所示,包括:
步驟101,服務(wù)器在影片數(shù)據(jù)庫中獲取影片劇情信息;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于環(huán)球智達(dá)科技(北京)有限公司,未經(jīng)環(huán)球智達(dá)科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710756859.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





