[發明專利]基于主場景鏡頭關鍵幀的體育視頻分類方法有效
| 申請號: | 200910089358.5 | 申請日: | 2009-07-17 |
| 公開(公告)號: | CN101604325A | 公開(公告)日: | 2009-12-16 |
| 發明(設計)人: | 董遠;黃煜斌 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 主場 鏡頭 關鍵 體育 視頻 分類 方法 | ||
技術領域
本發明屬于多媒體信息處理與檢索領域關于體育視頻分類的方法,其實質是一種利用鏡 頭關鍵幀聚類后提取具有代表性信息的主場景鏡頭關鍵幀然后對其做分類的方法,是一種自 動的魯棒性強的以及運算復雜度低的體育視頻處理方法。
背景技術
現今隨著計算機技術和互聯網技術的發展,觸手可及的多媒體信息呈現出爆炸式增長, 而且這種增長越來越迅速,互聯網已成為一個浩瀚的海量多媒體信息源。人們可以通過從有 線電視或者IPTV錄制體育視頻,或者互聯網下載,產生大量的視頻。這種快速增長的視頻 數據催生了許多視頻的互聯網應用:視頻共享網站(如國外的Youtube,國內的優酷,土豆等) 像雨后春筍般的呈現,專門的視頻門戶網站也是日益增長,這些網站對視頻的存儲與傳播起 到了重要的作用,對海量的視頻數據的自動處理也提出了挑戰。
體育視頻在各類視頻中占據重要的分量。體育視頻具有實時性,體育賽事每天發生,每 時每刻都有大量的新內容創造出來。用戶必然需要以最快的方式得到最新的體育資訊消息, 體育視頻能以最大的容量呈現精彩的體育比賽場面和精彩鏡頭,用戶對體育視頻的需求也越 來越廣泛,越來越迫切。用戶觀看體育視頻的針對性很強,他只關注自己喜歡的那些體育種 類,對其他的體育種類很少甚至根本不關心。所以只有有效的做好體育視頻分類,才能使用 戶快速的找到自己想要的體育視頻。傳統的體育視頻分類是通過視頻文件命名信息或者人工 標注信息來進行分類,這種依賴耗費大量人力的工作顯然不再適合現在海量的視頻的分類。
為了實現自動的體育視頻分類,需要提取體育視頻中的反應體育種類的有效信息。體育 視頻的內容豐富,有許多信息可以用來表征這個視頻的體育種類。然而,其中字幕或者比分 信息由于受到電視轉播機構差異性的影響,不同的電視臺有不同的字幕表現形式,缺乏通用 的提取方法;所以我們通過提取視頻中場景信息來做體育分類。體育鏡頭大致分為遠景、中 景和特寫三種。其中最具有代表的是中景鏡頭,因為遠景包括的是場館內的大體空間信息, 而特寫只包含運動員的身體或動作信息,只有中景鏡頭才完整的保留了該項體育運動中最主 要的最本質的比賽場地信息,如場地顏色,紋理,邊緣等。觀察體育視頻可以知道,中景鏡 頭是體育視頻中最主要的鏡頭,其出現的時間和次數最多。但是對于一段未知的體育視頻, 首先無法得到其先前知識--具有某些特征信息,如籃球的籃筐、足球的球門等,其次不知道 中景鏡頭的起始和結束點,所以,只能通過無監督學習的方來來提取中景鏡頭信息。對一個 視頻先進行鏡頭分割,然后選取每一個鏡頭的關鍵幀,再提取其魯棒特征,特征相近的幀聚 到一起成為一類。通過不停的迭代直到聚類結果滿足一定的終止條件。這樣將所有的關鍵幀 聚成許多個大類,其中最大的類就是中景鏡頭,代表這個體育視頻。
發明的內容
為了設計一個自動的體育視頻分類系統,快速有效的識別體育種類,提高識別率,本發 明提出一個基于鏡頭關鍵幀聚類的體育視頻分類的方法。該方法首先采用自適應閾值的基于 圖理論的聚類方法,提取體育視頻的所有屬于中景鏡頭類的關鍵幀作為主場景,然后通過支 持向量機(SVM)來僅僅對主場景進行分類,而不是視頻的每一幀,從而達到自動的決定未知 視頻的體育種類,大大減少了計算量。具體來說是先對視頻按照進行鏡頭自動分割,把視頻 分成多個片段,每個片段屬于一個攝像機鏡頭拍攝的連續幀,然后在這些幀里邊選取關鍵幀 代表這個片段,再對關鍵幀提取魯棒性特征,將其映射到特征空間去,空間中相近的點聚集 到一起,其次在自適應閾值的基于圖理論的聚類結果中,選取的屬于中景鏡頭的那類作為主 場景,最后用SVM分類器對主場景進行分類,判斷其匹配之前訓練好的多個體育模型中的 哪一個。
技術方案如下。
一種基于主場景鏡頭關鍵幀的體育視頻分類的方法,其特征包括以下步驟:
步驟一,對體育視頻進行自動鏡頭分割,關鍵幀提取;步驟一具體包括:
對體育視頻進行自動鏡頭分割,把體育視頻分成多個片段,每個片段屬于一個攝像機鏡 頭拍攝的連續幀,然后在這些幀里邊選取中間時刻點的一幀作為該片段的關鍵幀代表這個片 段;
步驟二,提取關鍵幀的魯棒性特征;
步驟三,基于圖理論的自適應閾值聚類算法進行聚類,并選取主場景;步驟三具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910089358.5/2.html,轉載請聲明來源鉆瓜專利網。





