[發明專利]視頻文件的生成方法、裝置、終端及存儲介質有效
| 申請號: | 201910974857.6 | 申請日: | 2019-10-14 |
| 公開(公告)號: | CN112738634B | 公開(公告)日: | 2022-08-02 |
| 發明(設計)人: | 鄭微;呂偉偉 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | H04N21/472 | 分類號: | H04N21/472;H04N21/431;H04N21/439;H04N21/44 |
| 代理公司: | 北京新知遠方知識產權代理事務所(普通合伙) 11397 | 代理人: | 馬軍芳;張艷 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻文件 生成 方法 裝置 終端 存儲 介質 | ||
本公開實施例提供一種視頻文件的生成方法、裝置、終端及存儲介質;方法包括:響應于接收到的視頻編輯指令,呈現視頻編輯界面,所述視頻編輯界面中包括圖像選擇按鍵、音頻選擇按鍵中至少之一;響應于針對所述視頻編輯界面所包括按鍵的點擊操作,確定用于進行視頻合成的目標音頻和目標圖像;獲取所述目標音頻的各音頻幀對應的音頻參數;基于獲取的各所述音頻參數,生成對應各所述音頻幀的頻譜圖;基于生成的所述頻譜圖及所述目標圖像,生成對應各所述音頻幀的包含所述頻譜圖的多個視頻幀圖像;基于所述多個視頻幀圖像及所述目標音頻,進行視頻編碼,得到目標視頻文件。
技術領域
本公開實施例涉及圖像處理領域,尤其涉及一種視頻文件的生成方法、裝置、終端及存儲介質。
背景技術
隨著科學技術的發展,音樂數據不僅能夠被聽到,還可以被“看到”,音樂的可視化技術已被廣泛應用于音樂播放場景中。相關技術中,基于音樂數據的頻譜特征實現音樂波形的可視化,然而,此種技術僅考慮音頻數據本身,忽略其他附加因素,從而導致呈現的可視化效果單一,不能滿足用戶的多樣化需求。
發明內容
提供該發明內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該發明內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
第一方面,本公開實施例提供了一種視頻文件的生成方法,包括:
響應于接收到的視頻編輯指令,呈現視頻編輯界面,所述視頻編輯界面中包括圖像選擇按鍵、音頻選擇按鍵中至少之一;
響應于針對所述視頻編輯界面所包括按鍵的點擊操作,確定用于進行視頻合成的目標音頻和目標圖像;
獲取所述目標音頻的各音頻幀對應的音頻參數;
基于獲取的各所述音頻參數,生成對應各所述音頻幀的頻譜圖;
基于生成的所述頻譜圖及所述目標圖像,生成對應各所述音頻幀的包含所述頻譜圖的多個視頻幀圖像;
基于所述多個視頻幀圖像及所述目標音頻,進行視頻編碼,得到目標視頻文件。
上述方案中,所述基于獲取的各所述音頻參數,生成對應各所述音頻幀的頻譜圖,包括:
基于預設采樣頻率,對所述目標音頻進行采樣處理,得到采樣后的多個音頻幀對應的音頻參數;
分別對各所述采樣后的音頻幀的音頻參數進行傅里葉變換,生成對應各所述采樣后的音頻幀的頻譜圖。
上述方案中,所述基于獲取的各所述音頻參數,生成對應各所述音頻幀的頻譜圖,包括:
基于獲取的所述音頻參數,確定對應的各所述音頻幀的振幅;
基于各所述音頻幀的振幅,確定多個對應所述頻譜圖的頻譜包絡線;
分別將各所述頻譜包絡線與對應的各所述頻譜圖進行組合,得到對應的多個組合后的頻譜圖。
上述方案中,所述基于生成的所述頻譜圖及所述目標圖像,生成對應各所述音頻幀的包含所述頻譜圖的多個視頻幀圖像,包括:
對所述目標圖像進行模糊處理,得到對應的模糊目標圖像;
對所述目標圖像進行目標區域截取,得到目標區域圖像;
分別將所述目標區域圖像與各所述音頻幀的頻譜圖進行組合,得到對應的多個組合圖像;
分別以各所述組合圖像為前景、以所述模糊目標圖像為背景,生成對應的多個包含所述頻譜圖的視頻幀圖像。
上述方案中,所述對所述目標圖像進行目標區域截取,得到目標區域圖像,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910974857.6/2.html,轉載請聲明來源鉆瓜專利網。





