[發明專利]一種視頻剪輯方法、裝置、計算機可讀存儲介質及相機有效

申請號：	202010628033.6	申請日：	2020-07-02
公開（公告）號：	CN111918127B	公開（公告）日：	2023-04-07
發明（設計）人：	符崢;蔡錦霖;姜文杰	申請（專利權）人：	影石創新科技股份有限公司
主分類號：	H04N21/44	分類號：	H04N21/44;G01S11/14
代理公司：	深圳瑞天謹誠知識產權代理有限公司 44340	代理人：	溫青玲
地址：	518000 廣東省深圳市寶安區新安街道***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種視頻剪輯方法裝置計算機可讀存儲介質相機
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請適用于視頻處理領域，提供了一種視頻剪輯方法、裝置、計算機可讀存儲介質及相機。所述視頻剪輯方法包括：獲取聲音數據和與所述聲音數據對應的視頻數據，并生成與所述聲音數據對應的平面視頻幀；對所述聲音數據對應的平面視頻幀進行目標檢測，獲取目標信息；根據所述聲音數據和所述目標信息確定聲源目標；根據所述聲源目標生成剪輯的包括所述聲源目標的平面視頻。本申請實現難度小，在室內等嘈雜環境下，可以降低環境噪聲與室內混響對定位的影響，定位精度高，魯棒性強，且能基于聲源目標進行自動剪輯，視頻剪輯效果好；此外，通過本申請實施例在進行聲源目標定位時，僅需1個麥克風即可進行準確定位，成本較低，大大減少視頻剪輯的難度與成本。

技術領域

本申請屬于視頻處理領域，尤其涉及一種視頻剪輯方法、裝置、計算機可讀存儲介質及相機。

背景技術

隨著攝像與聲音采集硬件設備的不斷發展，視頻會議系統逐漸成為人們日常生活工作中交流溝通的重要渠道。在視頻會議中，通常需要同時獲取主講人的圖像與聲音，并在播放設備上同時播放并記錄到存儲設備中，或將聲音轉換成文字便于整理。由于會議可能存在多個主講人，因此視頻會議系統通常需要具備獲得不同角度視頻圖像和聲音的功能。

傳統視頻會議系統通過設置多個攝像頭采集視頻圖像，同時配備多個麥克風獲取聲音。在視頻會議系統的播放設備中，為了讓收看會議視頻的與會人員將注意力集中在主講者上，需要將視頻轉換成以主講者為中心視角的平面視頻，并記錄主講者的內容；當主講者由一人轉換至另一人時，視頻視角也隨之切換至新主講者。這一過程一般通過聲源定位實現?，F有技術方案通過麥克風陣列采集會議現場的聲音并對聲源定位，獲得聲源的位置信息，成本較高，且在室內環境下，受麥克風位置、環境噪聲與室內混響等因素的影響，會導致定位誤差，影響視頻剪輯效果，用戶體驗不佳。

發明內容

本申請實施例在于提供一種視頻剪輯方法、裝置、計算機可讀存儲介質、計算機設備及相機，旨在解決上述技術問題之一。

第一方面，本申請實施例提供了一種視頻剪輯方法，所述方法包括：

獲取聲音數據和與所述聲音數據對應的視頻數據，并生成與所述聲音數據對應的平面視頻幀；

對所述聲音數據對應的平面視頻幀進行目標檢測，獲取目標信息；

根據所述聲音數據和所述目標信息確定聲源目標；

根據所述聲源目標生成剪輯的包括所述聲源目標的平面視頻。

進一步地，所述獲取聲音數據和與所述聲音數據對應的視頻數據具體為：

獲取聲音數據和與所述聲音數據對應的平面視頻；

或者，

獲取聲音數據和與所述聲音數據對應的全景視頻；

根據所述全景視頻生成與所述聲音數據對應的平面視頻。