[發明專利]一種視頻剪輯方法、裝置、計算機可讀存儲介質及相機有效
| 申請號: | 202010628033.6 | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN111918127B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 符崢;蔡錦霖;姜文杰 | 申請(專利權)人: | 影石創新科技股份有限公司 |
| 主分類號: | H04N21/44 | 分類號: | H04N21/44;G01S11/14 |
| 代理公司: | 深圳瑞天謹誠知識產權代理有限公司 44340 | 代理人: | 溫青玲 |
| 地址: | 518000 廣東省深圳市寶安區新安街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻剪輯 方法 裝置 計算機 可讀 存儲 介質 相機 | ||
本申請適用于視頻處理領域,提供了一種視頻剪輯方法、裝置、計算機可讀存儲介質及相機。所述視頻剪輯方法包括:獲取聲音數據和與所述聲音數據對應的視頻數據,并生成與所述聲音數據對應的平面視頻幀;對所述聲音數據對應的平面視頻幀進行目標檢測,獲取目標信息;根據所述聲音數據和所述目標信息確定聲源目標;根據所述聲源目標生成剪輯的包括所述聲源目標的平面視頻。本申請實現難度小,在室內等嘈雜環境下,可以降低環境噪聲與室內混響對定位的影響,定位精度高,魯棒性強,且能基于聲源目標進行自動剪輯,視頻剪輯效果好;此外,通過本申請實施例在進行聲源目標定位時,僅需1個麥克風即可進行準確定位,成本較低,大大減少視頻剪輯的難度與成本。
技術領域
本申請屬于視頻處理領域,尤其涉及一種視頻剪輯方法、裝置、計算機可讀存儲介質及相機。
背景技術
隨著攝像與聲音采集硬件設備的不斷發展,視頻會議系統逐漸成為人們日常生活工作中交流溝通的重要渠道。在視頻會議中,通常需要同時獲取主講人的圖像與聲音,并在播放設備上同時播放并記錄到存儲設備中,或將聲音轉換成文字便于整理。由于會議可能存在多個主講人,因此視頻會議系統通常需要具備獲得不同角度視頻圖像和聲音的功能。
傳統視頻會議系統通過設置多個攝像頭采集視頻圖像,同時配備多個麥克風獲取聲音。在視頻會議系統的播放設備中,為了讓收看會議視頻的與會人員將注意力集中在主講者上,需要將視頻轉換成以主講者為中心視角的平面視頻,并記錄主講者的內容;當主講者由一人轉換至另一人時,視頻視角也隨之切換至新主講者。這一過程一般通過聲源定位實現?,F有技術方案通過麥克風陣列采集會議現場的聲音并對聲源定位,獲得聲源的位置信息,成本較高,且在室內環境下,受麥克風位置、環境噪聲與室內混響等因素的影響,會導致定位誤差,影響視頻剪輯效果,用戶體驗不佳。
發明內容
本申請實施例在于提供一種視頻剪輯方法、裝置、計算機可讀存儲介質、計算機設備及相機,旨在解決上述技術問題之一。
第一方面,本申請實施例提供了一種視頻剪輯方法,所述方法包括:
獲取聲音數據和與所述聲音數據對應的視頻數據,并生成與所述聲音數據對應的平面視頻幀;
對所述聲音數據對應的平面視頻幀進行目標檢測,獲取目標信息;
根據所述聲音數據和所述目標信息確定聲源目標;
根據所述聲源目標生成剪輯的包括所述聲源目標的平面視頻。
進一步地,所述獲取聲音數據和與所述聲音數據對應的視頻數據具體為:
獲取聲音數據和與所述聲音數據對應的平面視頻;
或者,
獲取聲音數據和與所述聲音數據對應的全景視頻;
根據所述全景視頻生成與所述聲音數據對應的平面視頻。
進一步地,所述目標信息包括目標對應的平面視頻幀和目標的位置信息;
所述根據所述聲音數據和所述目標信息確定聲源目標具體為:
根據所述聲音數據和所述目標對應的平面視頻幀確定聲源目標。
進一步地,獲取所述目標對應的平面視頻幀具體為:
通過目標檢測算法獲得目標的位置信息,并根據目標的位置信息和預設的圖像大小從所述聲音數據對應的平面視頻幀中截取包括目標的平面視頻幀。
進一步地,所述目標的位置信息通過以下方式獲?。?/p>
采用目標檢測算法檢測所述平面視頻幀的所有目標,并用矩形框來表示每一個目標,通過所述矩形框坐標來確定目標的位置信息。
進一步地,所述根據所述聲音數據和所述目標信息確定聲源目標具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于影石創新科技股份有限公司,未經影石創新科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010628033.6/2.html,轉載請聲明來源鉆瓜專利網。





