[發明專利]視頻文件的切分方法及裝置在審

申請號：	201410143826.3	申請日：	2014-04-10
公開（公告）號：	CN103905742A	公開（公告）日：	2014-07-02
發明（設計）人：	崔玉斌;宿玉文	申請（專利權）人：	北京數碼視訊科技股份有限公司
主分類號：	H04N5/262	分類號：	H04N5/262;H04N21/233;H04N21/234;H04N21/439;H04N21/44
代理公司：	北京康信知識產權代理有限責任公司 11240	代理人：	吳貴明;張永明
地址：	100085 北京市海淀區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	視頻文件切分方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及通信領域，具體而言，涉及一種視頻文件的切分方法及裝置。

背景技術

圖1是根據相關技術的新聞節目大數據Map-Reduce并行處理流程的示意圖。如圖1所示，在Hadoop中的每個數據節點上運行Map作業，各自處理一路新聞電視節目。Map主要執行以下兩種操作：

其一、是采用語音識別算法對電視新聞播音員的語音數據進行處理；

其二、是進行視頻內容分析和視頻切分輸出新媒體數據。

其中，Map第一階段的主要目的在于對視頻段進行語音識別分析以獲取語音關鍵詞作為標簽，并為新媒體內容搜索建立索引。而Map第二階段的主要目的在于產生當今日益流行的三屏新媒體短視頻內容。然后再由Reduce作業將新媒體內容進行分類聚合，從而適應于新媒體聚合門戶應用。

然而，上述技術方案存在如下缺陷：相關技術中為了并行計算而簡單切分文件會導致語音識別的準確率下降。另外，自動化切分新媒體內容缺乏緊密性、準確性和完整性。

發明內容

本發明提供了一種視頻文件的切分方法及裝置，以至少解決相關技術中為了并行計算而簡單切分文件會導致語音識別的準確率下降的問題。

根據本發明的一個方面，提供了一種視頻文件的切分方法。

根據本發明實施例的視頻文件的切分方法包括：將通過聲紋識別獲取到的音頻文件劃分為N個時間長度相同的音頻數據段，再根據各個音頻數據段的內容相似度對相鄰的多個音頻數據段進行合并，生成M個音頻數據單元，其中，M<N，N和M均為正整數；分別獲取每個音頻數據單元對應的視頻圖像幀所在的視頻圖像組（GoP），并對該GoP以及與該GoP前后相鄰的兩個GoP進行碼流分析；根據碼流分析結果對與音頻文件同步播放的視頻文件進行切分。

優選地，根據各個音頻數據段的內容相似度對相鄰的多個音頻數據段進行合并，生成M個音頻數據單元包括：按照預先設定的關鍵詞類別分別對每個音頻數據段中出現的多個關鍵詞進行分類；對每種分類中的各個關鍵詞的出現頻率進行統計分析并在對每個關鍵詞的出現頻率進行降序排列后選取前X個關鍵詞，其中，X為正整數；判斷相鄰的多個音頻數據段中各自選取的前X個關鍵詞的重復率是否超過預設閾值；如果是，則對相鄰的多個音頻數據段進行合并。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京數碼視訊科技股份有限公司，未經北京數碼視訊科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410143826.3/2.html，轉載請聲明來源鉆瓜專利網。