[發(fā)明專利]一種基于色彩分布分析的視頻摘要內(nèi)容提取方法有效
| 申請?zhí)枺?/td> | 201310283274.1 | 申請日: | 2013-07-07 |
| 公開(公告)號: | CN103377294A | 公開(公告)日: | 2013-10-30 |
| 發(fā)明(設(shè)計)人: | 吳春明;熊偉;姜明 | 申請(專利權(quán))人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 周烽 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 色彩 分布 分析 視頻 摘要 內(nèi)容 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明提供一種基于色彩分布分析,度量視頻內(nèi)容重要度,并提取重要內(nèi)容作為視頻摘要的方法,視頻內(nèi)容摘要主要用于電視電影片花、視頻索引、視頻瀏覽、視頻檢索等,是計算機視覺領(lǐng)域的一個重要內(nèi)容。
背景技術(shù)
隨著現(xiàn)代社會電子化和信息化的發(fā)展,視頻音頻的多媒體數(shù)據(jù)已經(jīng)成為信息處理領(lǐng)域的主要表現(xiàn)方式,而視頻數(shù)據(jù)以其豐富的信息量和直觀的視聽感受,在社會生活的各個領(lǐng)域應(yīng)用越來越廣泛,人們?nèi)找婷媾R非常多迅速增加的視頻數(shù)據(jù)的處理需求,對視頻數(shù)據(jù)進行有效的組織和管理,從而提高視頻的使用效率。然而,視頻數(shù)據(jù)不同于字符信息,同時包含了動態(tài)的圖像和聲音,是一種流式的非結(jié)構(gòu)化的數(shù)據(jù)。一般的數(shù)據(jù)管理技術(shù)不能從內(nèi)容上對視頻數(shù)據(jù)進行有效的分析和管理,導致傳統(tǒng)計算機視頻處理是基于像素的處理,難以抽象出人類可以感知的內(nèi)容。因此,需要視頻內(nèi)容摘要技術(shù)來解決這一系列的問題。
視頻摘要是以自動或半自動的方式對視頻的結(jié)構(gòu)和內(nèi)容進行分析,從視頻文件中提取出有意義的部分,并將它們以某種方式進行組合,形成簡潔的、能夠充分表現(xiàn)視頻語義內(nèi)容的概要。它是對長視頻內(nèi)容的簡短總結(jié),通常用一段靜態(tài)或者動態(tài)的圖像序列來表示,并對原始信息予以保留。傳統(tǒng)的視頻摘要技術(shù)主要分為兩類,第一類是通過將連續(xù)幀序列的信息合成,把一個原始視頻流轉(zhuǎn)化成一種合成幀序列,每一個合成幀包含多個幀序列信息,這種方法形成的視頻摘要類似于一組幻燈片,主要應(yīng)用在視頻流中有大量重復信息的場合,如視頻監(jiān)控領(lǐng)域,而不適用于通用的視頻摘要;第二類是通過一定的規(guī)則提取源視頻的子序列集合,按照時間關(guān)系將這個集合中的子序列再合成為摘要視頻,這類方法生成的視頻摘要具有一般視頻流的形式,通常也稱為片花。第二類方法的傳統(tǒng)提取規(guī)則通常是按照預先設(shè)定或者隨機的位置提取場景內(nèi)摘要,雖然易于實現(xiàn),但是處理不同視頻時結(jié)果的浮動較大。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種基于色彩分布分析的視頻摘要內(nèi)容提取方法。
本發(fā)明的目的是通過以下技術(shù)方案來實現(xiàn)的:一種基于色彩分布分析的視頻摘要內(nèi)容提取方法,該方法包括以下步驟:
(1)視頻場景分割,該步驟通過以下子步驟來實現(xiàn):
(1.1)讀取原視頻:V={fi|i=1,2,...,n},其中n為視頻流V的幀數(shù),fi為視頻流的第i幀;
(1.2)計算相鄰幀的色彩直方圖距離集合:{D(i)=Hist(fi,fi+1)|i=1,2,...,n-1},其中Hist(fi,fi+1)為計算第i幀和i+1幀直方圖距離的函數(shù),簡記為D(i),可根據(jù)實際情況采用具體的函數(shù),常用的有Bhattacharyya距離、相交量等;
(1.3)確定場景分割的全局閾值T∈(0,1),通常根據(jù)視頻類型預先設(shè)定一個經(jīng)驗值;
(1.4)遍歷相鄰幀距離,對每兩個相鄰幀進行判斷;如果相鄰幀距離大于全局閾值T,則認為這兩幀是場景的邊界;如果相鄰幀距離小于全局閾值T,則認為這兩幀是同屬一個場景內(nèi);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學,未經(jīng)浙江大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310283274.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





