[發明專利]一種基于人工智能的一種視頻自動準確切割方法及其應用在審

申請號：	202210624439.6	申請日：	2022-06-02
公開（公告）號：	CN115346148A	公開（公告）日：	2022-11-15
發明（設計）人：	林劍鋒;宣忠	申請（專利權）人：	江蘇網博視界網絡科技股份有限公司
主分類號：	G06V20/40	分類號：	G06V20/40;G06V20/70;G06V40/16;G06V40/20;G06F40/30;G06F40/258;G06F16/738;G06F16/75;G06F16/783;H04N21/845;G10L15/26;G11B33/14;G11B33/08;C09D
代理公司：	暫無信息	代理人：	暫無信息
地址：	213000 ***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于人工智能視頻自動準確切割方法及其應用
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了基于人工智能的一種視頻自動準確切割方法，通過運用人工智能識別技術，先將視頻進行初次影像、音頻切割，隨后將多種算法的結合綜合應用，通過綜合處理數據，對視頻中的人物、場景、動作、視頻內容等信息進行分析，根據視頻中顯示的不同內容，實現視頻自動切割分段，準確率可以達到99％。而且提高了視頻自動切割的速率，可以保留圖像更多的動態范圍。可以讓影片的畫質、顏色都達到最佳級別。而且借助計算機主機得以實現；所述計算機主機至少包括固態硬盤，固態硬盤具有防護涂層，保證固態磁盤內的組件可以實現穩定固定，保證視頻自動切割系統的運行穩定性，協同促進視頻自動切割的精度率和速率。

技術領域

本發明涉及的是視頻處理領域，H04N21/44，尤其涉及一種基于人工智能的一種視頻自動準確切割方法及其應用。

背景技術

視頻是現代人們生活、學習、娛樂的主要方式之一，有時會需要對現有視頻進行切割處理，如新聞截取、視頻錄制中的脫敏處理，其中視頻切割技術則尤為重要。目前，視頻切割技術主要是通過人工打點標記添加切割點實現視頻切割，但這樣的工作量大，耗費時間和人力。而現在興起的智能視頻切割技術主要是通過圖像識別或語音識別技術對視頻中的視容或者視頻中的人物進行智能識別處理，進而實現了視頻的切割處理，提高了工作效率，但是由于視頻的復雜性，其識別效果差。

專利CN201811536818.X公開了一種視頻切割方法、裝置、計算機設備和存儲介質，通過將視頻數據中的影像數據和音頻數據分別輸入打點行為識別模型和打點語音識別模型中，得到打點識別結果并添加切割點標識，完成視頻數據流的切割處理，該過程不需要人工進行打點操作，提高了視頻切割的處理效率。專利CN202010281326.1提供了一種利用視頻內容進行視頻切割的方法、系統、介質及智能設備，通過對錄像視頻的音頻進行特征提取判斷其是否受損，去除嘈雜的背景音，或者將圖像特征數據與人聲數據進行擬合，使說話者的聲音更加突出，解決了現有視頻剪輯效率低、視頻質量差等問題。視頻切割識別的準確度較差，多種算法綜合應用較難，準確度只有40～50％。

發明內容

為了解決上述問題，本發明的第一方面提供了一種基于人工智能的一種視頻自動準確切割方法，包括以下步驟：

S1.導入錄制視頻素材，提取待識別視頻數據10；

所述待識別視頻數據10包括影像數據101、音頻數據102、圖像數據103、文本數據104。

S2.將視頻數據10輸入預設的智能識別模塊20中，將視頻自動切割分段為視頻子集。

所述S2將視頻數據輸入預設的智能識別模塊20中，將視頻自動切割分段為視頻子集，具體包括如下步驟：

S201.將影像數據101、圖像數據103輸入到預設的影像識別模塊201中進行分析，自動添加切割點，并將視頻自動切割分段為視頻子集1；

S202.將音頻數據102、文本數據104輸入到預設的音頻識別模塊202中進行分析，自動添加切割點，并將視頻自動切割分段為視頻子集2；

S203.將自動切割分段份視頻子集1和視頻子集2輸入到綜合數據處理模塊203中進行分析，自動添加切割點，并將視頻自動切割分段為視頻子集3。

所述影像識別模塊201包括人臉識別單元2011、轉場幀識別單元2012、場景識別單元 2013、視頻比對單元2014、動作識別單元2015。通過影像識別模塊201，可以將視頻中特定場景和鏡頭切割出來，如：開車鏡頭、擁抱鏡頭、機場、公交站、會議等，分鏡頭切割，實現畫面的精確切割。

所述音頻識別模塊202包括：語音識別單元2021、語義分析單元202。通過音頻識別模塊，進行語音、語義分析，得到合適的切割點，避免斷句錯誤的問題。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。