[發明專利]基于深度學習的視頻剪輯方法、相關設備及存儲介質在審
| 申請號: | 202110243565.2 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN113709384A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 蘇業;董偉;徐敘遠;張培成;王燁鑫 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | H04N5/262 | 分類號: | H04N5/262;G06N20/00;G06N3/08;G06N3/04;G06K9/00 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 視頻剪輯 方法 相關 設備 存儲 介質 | ||
1.一種基于深度學習的視頻剪輯方法,其特征在于,包括:
獲取目標視頻以及關于所述目標視頻的剪輯需求,所述目標視頻中包括一個或多個對象;
調用深度學習模型對所述目標視頻中的各個對象進行屬性識別,得到所述各個對象的屬性信息,所述深度學習模型是利用深度學習技術進行模型訓練,所得到的具有屬性識別能力的模型;
根據所述各個對象的屬性信息,從所述一個或多個對象中選取滿足所述剪輯需求的目標對象;
從所述目標視頻中剪輯出與所述目標對象相關聯的多個圖像組,并采用所述多個圖像組,生成所述目標視頻對應的剪輯視頻。
2.如權利要求1所述的方法,其特征在于,所述從所述目標視頻中剪輯出與所述目標對象相關聯的多個圖像組,包括:
對所述目標視頻進行低質圖像檢測處理,得到所述目標視頻中的低質圖像,所述低質圖像包括以下至少一種:根據圖像清晰度所確定的模糊圖像、重復圖像,以及同時包含多個對象的多人同框圖像;
從所述目標視頻中過濾掉所述低質圖像,得到有效視頻;并從所述有效視頻中剪輯出與所述目標對象相關聯的多個圖像組。
3.如權利要求2所述的方法,其特征在于,所述低質圖像包括所述模糊圖像,所述對所述目標視頻進行低質圖像檢測處理,得到所述目標視頻中的低質圖像,包括:
獲取與所述目標視頻所適配的動態清晰度閾值;
遍歷所述目標視頻中的各幀圖像,并對當前遍歷的當前圖像進行卷積處理,得到卷積圖像;
對所述卷積圖像中的各個像素值進行均值運算,并根據計算得到的均值和所述各個像素值之間的差異,計算所述當前圖像的圖像清晰度;
若所述當前圖像的圖像清晰度小于所述動態清晰度閾值,則將所述當前圖像確定為所述模糊圖像。
4.如權利要求2所述的方法,其特征在于,所述目標視頻是采用多個鏡頭拍攝得到的,所述低質圖像包括所述模糊圖像;所述對所述目標視頻進行低質圖像檢測處理,得到所述目標視頻中的低質圖像,包括:
獲取與所述目標視頻所適配的動態清晰度閾值;
將所述目標視頻拆分成多個分鏡片段,并遍歷所述多個分鏡片段,一個分鏡片段中的各幀圖像是采用同一個鏡頭拍攝得到;
計算當前遍歷的當前分鏡片段中的各幀圖像的圖像清晰度,并根據所述當前分鏡片段中的各幀圖像的圖像清晰度,計算得到所述當前分鏡片段的片段清晰度;
若所述片段清晰度小于所述動態清晰度閾值,則將所述當前分鏡片段中的各幀圖像均確定為所述模糊圖像。
5.如權利要求3或4所述的方法,其特征在于,所述獲取與所述目標視頻所適配的動態清晰度閾值,包括:
對所述目標視頻進行圖像采樣處理,得到K幀采樣圖像,K為正整數;
分別計算各幀采樣圖像的圖像清晰度,并按照閾值計算策略根據所述各幀采樣圖像的圖像清晰度,計算與所述目標視頻所適配的動態清晰度閾值;
其中,所述閾值計算策略用于指示:按照圖像清晰度從大到小的順序對所述各幀采樣圖像進行重排列,并將重排列后的第k個采樣圖像的圖像清晰度作為所述動態清晰度閾值,k∈[1,K];或者,將所述各幀采樣圖像的圖像清晰度的均值作為所述動態清晰度閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110243565.2/1.html,轉載請聲明來源鉆瓜專利網。





