[發明專利]融合視聽覺特征的視頻表現力識別方法、終端及存儲介質在審
| 申請號: | 201711275404.1 | 申請日: | 2017-12-06 |
| 公開(公告)號: | CN108307205A | 公開(公告)日: | 2018-07-20 |
| 發明(設計)人: | 仝小敏;李鵬;吉祥;吳鴿鵬 | 申請(專利權)人: | 中國電子科技集團公司電子科學研究院 |
| 主分類號: | H04N21/24 | 分類號: | H04N21/24;H04N21/234;H04N21/233;H04N21/81;G06K9/62;G10L25/03;G10L25/57 |
| 代理公司: | 工業和信息化部電子專利中心 11010 | 代理人: | 于金平 |
| 地址: | 100041 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 聽覺特征 音頻特征 計算機可讀存儲介質 終端 存儲介質 視覺特征 視頻特征 有效解決 融合 訪問量 上傳 時長 預設 確定性 | ||
1.一種融合視聽覺特征的視頻表現力識別方法,其特征在于,包括:
根據預設視頻的訪問量和上傳時長得到視頻表現力真值,提取所述視頻的視覺特征和音頻特征,并將所述視頻的視覺特征、音頻特征以及該視頻對應的視頻表現力真值進行訓練,得到視頻表現力識別模型;
提取待測視頻的視覺特征,并提取待測視頻的音頻特征,將所述視覺特征和音頻特征,帶入所述視頻表現力識別模型得到所述待測視頻的視頻表現力真值。
2.根據權利要求1所述的方法,其特征在于,
所述預設視頻為互聯網上的視頻廣告。
3.根據權利要求1所述的方法,其特征在于,將所述視頻和該視頻對應的視頻表現力真值進行訓練,得到視頻表現力識別模型,具體包括:
將所述視頻和該視頻對應的視頻表現力真值帶入支持向量機SVM進行SVM訓練,得到視頻表現力識別模型。
4.根據權利要求1所述的方法,其特征在于,
所述視覺特征包括以下中的一種或多種:BoW特征、GIST特征、顏色矩特征和顏色直方圖特征。
5.根據權利要求1所述的方法,其特征在于,提取待測視頻的音頻特征,具體包括:
將待測視頻轉化為音頻格式的音頻文件,并對音頻文件提取音頻特征。
6.根據權利要求5所述的方法,其特征在于,對音頻文件提取音頻特征,具體包括:
提取音頻文件中的節奏、音調、音量和音色信息。
7.一種終端,其特征在于,所述終端包括處理器、存儲器及通信總線;
所述通信總線用于實現處理器和存儲器之間的連接通信;
所述處理器用于執行存儲器中存儲的計算機指令,以實現權利要求1至6中任一項所述的融合視聽覺特征的視頻表現力識別方法。
8.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執行,以實現權利要求1至6中的任一項所述的融合視聽覺特征的視頻表現力識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司電子科學研究院,未經中國電子科技集團公司電子科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711275404.1/1.html,轉載請聲明來源鉆瓜專利網。





