[發(fā)明專利]一種漸變轉(zhuǎn)場的識別方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010165457.3 | 申請日: | 2020-03-11 |
| 公開(公告)號: | CN111428589B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計)人: | 王燦進 | 申請(專利權(quán))人: | 新華智云科技有限公司;新華融合媒體科技發(fā)展(北京)有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/774;G06V10/764;G06V10/74 |
| 代理公司: | 杭州裕陽聯(lián)合專利代理有限公司 33289 | 代理人: | 田金霞 |
| 地址: | 310012 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 漸變 轉(zhuǎn)場 識別 方法 系統(tǒng) | ||
本發(fā)明公開一種漸變轉(zhuǎn)場的識別方法及系統(tǒng),其中識別方法包括以下步驟:獲取待檢測視頻,利用預(yù)設(shè)的滑動窗口遍歷所述待檢測視頻,獲得第一視頻片段;基于預(yù)設(shè)的轉(zhuǎn)場識別模型對所述第一視頻片段進行轉(zhuǎn)場識別,對識別出轉(zhuǎn)場的第一視頻片段進行提取,獲得第二視頻片段;基于預(yù)設(shè)的類型預(yù)測模型對各第二視頻片段的轉(zhuǎn)場類型進行預(yù)測,獲得各第二視頻片段的轉(zhuǎn)場類型;基于各第二視頻片段的轉(zhuǎn)場類型確定所述待檢測視頻中的轉(zhuǎn)場區(qū)間,并確定所述轉(zhuǎn)場區(qū)間的轉(zhuǎn)場類型。與現(xiàn)有基于顏色分析實現(xiàn)的轉(zhuǎn)場識別方法相比,本發(fā)明通過利用深度學習技術(shù)對待檢測視頻中的漸變轉(zhuǎn)場進行識別,能夠克服在鏡頭晃動、虛焦等不利條件下的誤識別,提高準確率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別領(lǐng)域,尤其涉及一種漸變轉(zhuǎn)場的識別方法及系統(tǒng)。
背景技術(shù)
申請?zhí)枮镃N201610687298.7的“一種識別鏡頭切換的方法及裝置”中提出:等間隔提取出待檢測視頻的關(guān)鍵幀,然后將關(guān)鍵幀分為若干子區(qū)域,通過計算不同關(guān)鍵幀子區(qū)域的顏色或亮度直方圖的加權(quán)距離來判斷是否存在鏡頭切換;
申請?zhí)枮镃N201410831291.9的“基于幀差聚類的視頻鏡頭切換檢測方法及其裝置”中提出:計算連續(xù)三幀中每兩幀圖像的灰度值差生成三維向量,通過聚類器將三維向量映射成空間坐標系中的點,設(shè)置半徑參數(shù)生成包含球,點在球內(nèi)為有鏡頭切換;
由上可知,現(xiàn)今基于顏色分析實現(xiàn)對轉(zhuǎn)場的檢測,但此種檢測方法不適用于對逐幀過渡的漸變轉(zhuǎn)場進行識別和定位,且易受到拍攝質(zhì)量的影響,如將鏡頭晃動誤認為漸變轉(zhuǎn)場。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術(shù)中的缺點,提供了一種漸變轉(zhuǎn)場的識別方法及系統(tǒng)。
為了解決上述技術(shù)問題,本發(fā)明通過下述技術(shù)方案得以解決:
一種漸變轉(zhuǎn)場的識別方法,包括以下步驟:
獲取待檢測視頻,利用預(yù)設(shè)的滑動窗口遍歷所述待檢測視頻,獲得第一視頻片段;
基于預(yù)設(shè)的轉(zhuǎn)場識別模型對所述第一視頻片段進行轉(zhuǎn)場識別,對識別出轉(zhuǎn)場的第一視頻片段進行提取,獲得第二視頻片段;
基于預(yù)設(shè)的類型預(yù)測模型對各第二視頻片段的轉(zhuǎn)場類型進行預(yù)測,獲得各第二視頻片段的轉(zhuǎn)場類型;
基于各第二視頻片段的轉(zhuǎn)場類型確定所述待檢測視頻中的轉(zhuǎn)場區(qū)間,并確定所述轉(zhuǎn)場區(qū)間的轉(zhuǎn)場類型。
作為一種可實施方式,轉(zhuǎn)場識別模型的獲取方法為:
收集樣本視頻片段,判斷所述樣本視頻片段是否包含轉(zhuǎn)場,將包含轉(zhuǎn)場的樣本視頻片段作為訓練正樣本,將不包含轉(zhuǎn)場的樣本視頻片段作為訓練負樣本;
利用所述訓練正樣本和所述訓練負樣本訓練獲得轉(zhuǎn)場識別模型,所述轉(zhuǎn)場識別模型用于識別所輸入的第一視頻片段是否為轉(zhuǎn)場。
作為一種可實施方式,類型預(yù)測模型的獲取方法為:
基于轉(zhuǎn)場類型對所述訓練正樣本進行標注,生成預(yù)測訓練數(shù)據(jù);
利用所述預(yù)測訓練數(shù)據(jù)訓練獲得類型預(yù)測模型,所述類型預(yù)測模型的輸入為第二視頻片段,輸出為所述第二視頻片段的轉(zhuǎn)場類型或所述第二視頻片段的特征。
作為一種可實施方式,當類型預(yù)測模型的輸出為特征時,基于預(yù)設(shè)的類型預(yù)測模型對各第二視頻片段的轉(zhuǎn)場類型進行預(yù)測,獲得各第二視頻片段的轉(zhuǎn)場類型的具體步驟為:
將類型預(yù)測模型輸出的特征作為第一特征;
將所述第一特征與預(yù)設(shè)的轉(zhuǎn)場特征庫中的第二特征進行相似度匹配,獲得匹配結(jié)果,根據(jù)所述匹配結(jié)果確定所述第一特征的轉(zhuǎn)場類型,并將所述轉(zhuǎn)場類型作為相應(yīng)第二視頻片段所對應(yīng)的轉(zhuǎn)場類型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新華智云科技有限公司;新華融合媒體科技發(fā)展(北京)有限公司,未經(jīng)新華智云科技有限公司;新華融合媒體科技發(fā)展(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010165457.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 區(qū)域特效轉(zhuǎn)場方法及裝置
- 軌道轉(zhuǎn)場裝置、軌道轉(zhuǎn)場連接裝置、轉(zhuǎn)場系統(tǒng)及方法
- 一種基于混合模式轉(zhuǎn)場特效的方法
- 一種基于Objective?C的視圖轉(zhuǎn)場方法
- 一種轉(zhuǎn)場動畫制定方法、裝置及設(shè)備
- 中轉(zhuǎn)場規(guī)劃方法、裝置、服務(wù)器及存儲介質(zhì)
- 一種漸變轉(zhuǎn)場的識別方法及系統(tǒng)
- 一種視頻轉(zhuǎn)場的方法、系統(tǒng)、裝置及存儲介質(zhì)
- 基于iOS的自定義轉(zhuǎn)場方法
- 一種轉(zhuǎn)場飛機保障設(shè)備配置方法





