[發明專利]新聞視頻自動分條裝置及新聞視頻自動分條的方法有效
| 申請號: | 201310032025.5 | 申請日: | 2013-01-25 |
| 公開(公告)號: | CN103079041A | 公開(公告)日: | 2013-05-01 |
| 發明(設計)人: | 朱定局 | 申請(專利權)人: | 深圳先進技術研究院;深圳市天華世紀傳媒有限公司;深圳市天威視訊股份有限公司 |
| 主分類號: | H04N5/262 | 分類號: | H04N5/262 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 新聞 視頻 自動 裝置 方法 | ||
技術領域
本發明涉及視頻處理,尤其涉及一種新聞視頻自動分條裝置及新聞視頻自動分條的方法。
背景技術
目前新聞拆分要么是純手工拆分,要么是根據新的主題新聞開始時,剛開始的幾幀一般都靜音,來進行拆分。
手工拆分一個長度為N分鐘的新聞視頻,往往需要數倍于N分鐘的時間,人工成本太高,拆分速度太慢。
根據“新的主題新聞開始時,剛開始的幾幀一般都靜音”來拆分,往往把同一個主題新聞中鏡頭的切換切分為了不同的主題新聞,因為只要是鏡頭切換,都可能導致“剛開始的幾幀一般都靜音”,所以這種技術雖然比純手工拆分好,但在用這種技術進行初次切分后,還是需要人工進行大量的糾錯工作。
發明內容
有鑒于此,有必要提供一種對新聞視頻自動分條、節省人工成本的方法。
本發明提供的新聞視頻自動分條裝置,包括提取模塊、特征識別模塊、判斷模塊以及拆分模塊。其中,提取模塊,用于自動提取新聞視頻中所有的靜音幀;存儲模塊,用于預先存儲播報員的聲音以及頭像,并存儲靜音幀及其時間點;特征識別模塊,用于根據所述播報員的聲音特征提取新聞視頻中含有播報員聲音的幀以及根據所述播報員頭像提取新聞視頻中含有播報員頭像的幀;判斷模塊,用于判斷新聞視頻中的所述靜音幀是否為包含播報員頭像的幀,其中,所述判斷模塊還用在所述靜音幀為包含播報員頭像的幀時判斷所述靜音幀之后的幀是否包含播報員的頭像與聲音;拆分模塊,用于在所述靜音幀之后的幀包含播報員頭像與聲音時將所述靜音幀設為起始幀,并從所述起始幀對應的時間點對新聞視頻進行拆分。
本發明還提供一種新聞視頻自動分條的方法,包括以下步驟:提取所述新聞視頻中的靜音幀;讀取新聞視頻的播報員的聲音特征;根據所述播報員的聲音特征提取新聞視頻中含有播報員聲音的幀;讀取新聞視頻中含有播報員頭像的幀;根據所述播報員頭像提取新聞視頻中含有播報員頭像的幀;判斷所述靜音幀中是否為包含所述播報員頭像的幀;若是,則判斷所述靜音幀之后的幀中是否包含播報員聲音與頭像;若是將所述靜音幀設為起始幀,并從所述起始幀對應的時間點對新聞視頻進行拆分。
本發明提供的新聞視頻自動分條裝置及新聞視頻自動分條的方法通過對靜音幀、包含播報員頭像幀以及包含播報員聲音幀綜合判斷來得到起始幀及其對應的時間點,以便對新聞視頻進行拆分,有效的提高了新聞視頻的拆分效率,減低了人工的工作量。
附圖說明
圖1為本發明一實施方式中新聞視頻自動分條裝置的模塊圖;
圖2為本發明一實施方式中新聞視頻自動分條方法的流程圖。
具體實施方式
下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發明,而不能理解為對本發明的限制。
在本發明的描述中,術語“內”、“外”、“縱向”、“橫向”、“上”、“下”、“頂”、“底”等指示的方位或位置關系為基于附圖所示的方位或位置關系,僅是為了便于描述本發明而不是要求本發明必須以特定的方位構造和操作,因此不能理解為對本發明的限制。
請參閱圖1,圖1所示為本發明一實施方式中新聞視頻自動分條裝置10的模塊圖。
在本實施方式中,新聞視頻自動分條裝置10包括:獲取模塊102、特征識別模塊104、判斷模塊106、拆分模塊108、處理器110以及存儲模塊112,獲取模塊102、特征識別模塊104、判斷模塊106以及拆分模塊108存儲在存儲模塊112中,處理器110用于執行存儲模塊112中的各個模塊。
在本實施方式中,提取模塊102用于自動提取新聞視頻中所有的靜音幀。
存儲模塊112用于預先存儲播報員的聲音以及頭像,并存儲靜音幀及其時間點。
特征識別模塊104用于根據所述播報員的聲音特征提取新聞視頻中含有播報員聲音的幀以及根據所述播報員頭像提取新聞視頻中含有播報員頭像的幀。
在本實施方式中,所述存儲模塊112將含有靜音幀的時間點存儲為靜音集合B={B1,B2,...,Bn},將播報員的聲音的幀的時間點存儲為聲音集合C={C1,C2,...,Cm}以及含有播報員的頭像的幀的時間點為頭像集合D={D1,D2,...,Dk}。
在本實施方式中,所述播報員與所述播報員的聲音是一一對應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院;深圳市天華世紀傳媒有限公司;深圳市天威視訊股份有限公司,未經深圳先進技術研究院;深圳市天華世紀傳媒有限公司;深圳市天威視訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310032025.5/2.html,轉載請聲明來源鉆瓜專利網。





