[發明專利]短視頻流行度預測方法、系統、電子設備及存儲介質在審
| 申請號: | 202110206067.0 | 申請日: | 2021-02-24 |
| 公開(公告)號: | CN112883231A | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 蔡君;張立安;劉燕;羅建楨;許迅妤 | 申請(專利權)人: | 廣東技術師范大學 |
| 主分類號: | G06F16/78 | 分類號: | G06F16/78;G06F16/783;G06N3/04;G06N3/08 |
| 代理公司: | 北京高航知識產權代理有限公司 11530 | 代理人: | 趙永強 |
| 地址: | 510630 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 流行 預測 方法 系統 電子設備 存儲 介質 | ||
本發明涉及一種短視頻流行度預測方法、系統、電子設備及存儲介質,其方法包括:獲取短視頻數據,包括文本信息、社交信息、時間序列信息;特征提取,將文本信息進行特征提取為文本特征表示,將社交信息、時間序列信息轉成矩陣形式特征表示;將文本特征,將社交信息特征、時間序列信息特征轉成圖像三通道模式,對三通道的圖像進行特征提取;將時間序列信息矩陣的順序,按照與播放量序列的皮爾遜相關性系數的大小順序依次排列,對時間進行歸一化處理,將時間序列信息矩陣轉成單通道圖像;建立熱門短視頻預測模型進行短視頻流行度預測。解決了內部噪聲對短視頻的影響,對循環神經網絡LSTM的參數值充分利用,對流行度預測的準確值較好。
技術領域
本發明涉及視頻流行度預測技術領域,更具體地說,涉及一種短視頻流行度預測方法、系統、電子設備及存儲介質。
背景技術
在過去幾年,智能設備出現前所未有的增長,使得用戶能夠用短視頻的方式記錄生活上傳到社交媒體網站。短視頻在許多方面有巨大的潛力,如在線營銷,在線廣告,網絡緩存等。短視頻在最近幾年非常火爆,如當下的抖音,快手,嗶哩嗶哩視頻網站等。
在視頻的流行度預測上,目前的主流方法是對數線性方法,支持向量機回歸方法,自編碼器方法等。純基于早期流行度預測的代表對數線性方法預測效果并不好,沒有考慮冷啟動的問題。后來添加與短視頻信息相關的特征與早期的流行度一起預測流行度。支持向量機回歸方法使用與視頻視覺特征,賦予其權重的作用作為補充。自編碼器方法討論了內部噪聲對短視頻分析的不利影響,使用編碼器編碼視覺特征,社交特征等,編碼成隱藏表示Z,作為LSTM網絡的參數值,再使用早期流行度預測短視頻的流行度。以上方法并沒有解決好內部噪聲對短視頻的影響,對循環神經網絡 LSTM的參數值利用效果有限,對流行度預測的準確值較差。
因此,現有技術亟待有很大的進步。
發明內容
本發明要解決的技術問題在于現有技術中對循環神經網絡LSTM的參數值利用效果有限,對流行度預測的準確值較差,針對現有技術的上述的缺陷,本發明一方面提供一種短視頻流行度預測方法,包括:
S1、獲取短視頻數據,所述短視頻數據包括文本信息、社交信息、時間序列信息;
S2、對所述短視頻數據進行特征提取,將文本信息進行特征提取為文本特征表示,將社交信息、時間序列信息轉成矩陣形式特征表示;
S3、將所述文本特征,將社交信息特征、時間序列信息特征轉成圖像的RGB三通道模式,對三通道的圖像進行特征提取;
S4、將時間序列信息矩陣的順序,按照與播放量序列的皮爾遜相關性系數的大小順序依次排列,并對時間進行歸一化處理,將時間序列信息矩陣轉成單通道圖像;
S5、建立熱門短視頻預測模型,將單通道圖像輸入熱門短視頻預測模型進行短視頻流行度預測。
優選地,在所述對所述短視頻數據進行特征提取步驟之前還包括:
對所述短視頻數據進行清洗、填充。
優選地,所述步驟S3、將所述文本特征,將社交信息特征、時間序列信息特征轉成圖像的RGB三通道模式,對三通道的圖像進行特征提取進一步包括:
S31、使用Bi-RNN模型將文本信息進行特征提取為文本表示,轉成圖像的R通道;
S32、將社交信息進行填充為二維的矩陣形式,轉成圖像的G通道;
S33、將時間序列信息轉為時間矩陣的形式再進行降維,轉成圖像的B 通道。
優選地,所述皮爾遜相關性系數包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東技術師范大學,未經廣東技術師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110206067.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于自定義規則的配置基線核查方法
- 下一篇:一種機器人人機交互方法





