[發明專利]通過音樂情感識別視頻廣告的方法有效
| 申請號: | 201910384279.0 | 申請日: | 2019-05-09 |
| 公開(公告)號: | CN110162671B | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 孫偉芳;張勇;董培祥 | 申請(專利權)人: | 央視國際網絡無錫有限公司 |
| 主分類號: | G06F16/783 | 分類號: | G06F16/783;G06F16/75;G06Q30/02 |
| 代理公司: | 常州佰業騰飛專利代理事務所(普通合伙) 32231 | 代理人: | 顧翰林 |
| 地址: | 214000 江蘇省無錫市震*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通過 音樂 情感 識別 視頻 廣告 方法 | ||
1.一種通過音樂情感識別視頻廣告的方法,其特征在于,包括:
S1獲取音樂文件集,并根據Valence-Arousal二維空間對音樂文件集中的音樂文件打分,得到各音樂文件的V-A真值;
S2分別提取音樂文件集中音樂文件的特征,使用音樂文件的特征作為輸入、V-A真值作為輸出對音樂情感識別模型進行訓練,完成音樂情感識別模型的搭建;
S3獲取配樂的待識別視頻,并每間隔一定時間作為一個節點提取音樂特征;
S4將提取的音樂特征輸入訓練好的音樂情感識別模型得到相應節點的V-A預測值;
S5根據得到的各節點的V-A預測值對視頻中的廣告進行識別;
在步驟S5中包括:
S51從視頻頭開始,計算預設時間段δ秒內包含的節點的空間方位角θ的平均值m;
S52判斷δ秒內是否存在空間方位角θ與平均值m間差值大于預設閾值ε的節點;若是,判定該節點對應的第t秒為疑似廣告節點,并跳轉至步驟S53;
S53在視頻中計算下一個時間段δ秒內包含的節點的空間方位角θ的平均值m’,并根據步驟S52中的方法找到下一個疑似廣告節點第t1秒;
S54根據兩個疑似廣告節點之間的時間差值識別視頻中的廣告。
2.如權利要求1所述的方法,其特征在于,在步驟S2中包括:
S21分別提取音樂文件集中音樂文件的特征,所述特征包括:音樂的音色特征、韻律特征及強度特征;
S22將音樂文件集分為訓練集和測試集;
S23根據訓練集使用其中的音樂文件的特征作為輸入、V-A真值作為輸出對音樂情感識別模型進行訓練;
S24根據測試集對音樂情感識別模型進行進一步優化調整,完成音樂情感識別模型的搭建。
3.如權利要求1所述的方法,其特征在于,V-A真值中包括Valence值和Arousal值;
當Valence0,Arousal0,代表高興、快樂、興奮類情緒,此時,0°θ90°,且隨著角度增大情緒強度增強,其中,空間方位角θ=arctan(Arousal/Valence);
當Valence0,Arousal0,代表害怕、憤怒、悲痛類情緒,此時,90°θ180°,且隨著角度增大情緒強度減弱,其中,空間方位角θ=180°+arctan(Arousal/Valence);
當Valence0,Arousal0,代表傷心、沮喪、厭煩類情緒,此時,180°θ270°,且隨著角度增大情緒強度減弱,其中,空間方位角θ=180°+arctan(Arousal/Valence);
當Valence0,Arousal0,代表滿足、輕松、疲乏類情緒,此時,270°θ360°,且隨著角度增大情緒強度增強,其中,空間方位角θ=360°+arctan(Arousal/Valence)。
4.如權利要求1所述的方法,其特征在于,在步驟S54中,若兩個疑似廣告節點之間的時間差值Δtδ,判斷兩個疑似廣告節點間為視頻內部的劇情切換;若ηΔtδ,判斷兩個疑似廣告節點間為廣告,其中,Δt=t1-t,η為預先設定閾值。
5.如權利要求4所述的方法,其特征在于,在步驟S54中,若判斷兩個疑似廣告節點之間為廣告,則截取兩個節點之間的視頻;
在截取過程中,根據預先設定的精度選定廣告截取的秒數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于央視國際網絡無錫有限公司,未經央視國際網絡無錫有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910384279.0/1.html,轉載請聲明來源鉆瓜專利網。





