[發明專利]一種鏡頭邊界檢測方法及系統在審
| 申請號: | 202010582564.6 | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111860185A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 王謙 | 申請(專利權)人: | 北京無限創意信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 東莞市神州眾達專利商標事務所(普通合伙) 44251 | 代理人: | 劉漢民 |
| 地址: | 100000 北京市通*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 鏡頭 邊界 檢測 方法 系統 | ||
本發明涉及一種鏡頭邊界檢測方法及系統,所述的一種鏡頭邊界檢測方法包括:獲取待檢測視頻;將待檢測視頻進行切割獲取切割片段;對切割片段通過像素亮度特征變化及運動補償算法計算,獲取候選片段;對候選片段進行切變檢測以及漸變檢測。通過本發明所述的一種鏡頭邊界檢測方法及系統能夠針對大多的視頻鏡頭高效的切割鏡頭邊界,提取鏡頭元素。
技術領域
本發明涉及一種視頻鏡頭分割邊界檢測技術領域,具體涉及一種鏡頭邊界檢測方法及系統。
背景技術
5G無線通信技術的出現,個人生產內容浪潮強勁,數字內容生產不再是專業群體的專利,大量用戶使用手機就可以生產內容,從而帶動數字資源不斷增加,反過來又促進人們對無線傳輸需求不斷加大,對有限帶寬資源形成了巨大的資源壓力。而且在個人生產內容的前提下海量無摘要視頻分發在互聯網上,由此相對應的是大量不良視頻傳播對用戶造成騷擾。另一方面,數字媒體中的視頻資源格式不盡相同,為了讓用戶在多媒體終端得到良好的視聽覺體驗,需要對視聽內容進行統一管理、運營和播放控制,對于差異化的網絡和終端播放條件提出系列視頻快速分析技術,本發明涉及鏡頭邊界提取方式是其中一個重要環節。
目前業界主要有三種提鏡頭邊界的方法:基于聚類的方法、基于機器學習的方法和基于曲線規劃的方法:
基于聚類的方法,即采用某種聚類算法將類似視頻幀聚為一簇,選取每簇中的中心視頻幀作為關鍵幀,以關鍵幀作為鏡頭邊界切割邊緣。具體的實現方法有模糊均值聚類算法、利用光譜聚類算法、相似度圖聚類算法等方式。聚類算法提取鏡頭邊界的缺陷在于需要提前設定聚類數目,但聚類數目量級由視頻的長度與內容決定,導致需要大量的人工參與干涉,更多應用于實驗室環境,無法應用于工程實例。
基于機器學習的方法,也稱之為基于字典學習。即使用人工智能算法從給定的視頻中學習提前標識好的字典,并動態更新字典中的元素,通過人工智能算法識別方式對視頻場景進行判定,提取字典元素并組織為鏡頭邊界提取要素。但此種方式需要大量已知標識數據訓練,并且對于開放性、字典元素眾多的長視頻識別效率較低,而無法應用于我方場景。
基于曲線規劃的方法,即將鏡頭邊界擬合成坐標軸中的曲線,通過簡化曲線作為鏡頭邊界切割邊緣。首先將視頻分割成長度相同的塊,然后根據該塊中發生的事件為每個塊分配一個優先級并繪制出優先權曲線,如果曲線圖中兩個峰值彼此相鄰,那么與此相關的兩個相鄰塊可能共同指代視頻中的連續事件,則合并相鄰的塊。以這種方式提取的鏡頭具有良好的連續性并避免了重復。但該方法只能描述視頻的主要變化點,細節變化不明顯。
為了解決上述問題,本發明提出一種鏡頭邊界檢測方法及系統。
發明內容
本發明解決的技術問題是,提供了一種鏡頭邊界檢測方法及系統。所述的一種鏡頭邊界檢測方法及系統,能夠針對大多的視頻鏡頭高效的切割鏡頭邊界,提取鏡頭元素。
為了解決上述技術問題,本發明提供的技術方案為:
一種鏡頭邊界檢測方法,包括:
獲取待檢測視頻;
將待檢測視頻進行切割獲取切割片段;
對切割片段通過像素亮度特征變化及運動補償算法計算,獲取候選片段;
對候選片段進行切變檢測以及漸變檢測。
優選地,所述的將待檢測視頻進行切割的方法為:
設定步長變量w;
每次移動步長k=(w-y)/2,進行片段切割,所述y為任意值。
優選地,所述的像素亮度特征變化及運動補償算法分別為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京無限創意信息技術有限公司,未經北京無限創意信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010582564.6/2.html,轉載請聲明來源鉆瓜專利網。





