[發(fā)明專利]一種視頻文件快速擇優(yōu)截圖的方法無效
| 申請?zhí)枺?/td> | 200810037284.6 | 申請日: | 2008-05-12 |
| 公開(公告)號: | CN101377846A | 公開(公告)日: | 2009-03-04 |
| 發(fā)明(設(shè)計(jì))人: | 王磊 | 申請(專利權(quán))人: | 上海激動(dòng)通信有限公司 |
| 主分類號: | G06T1/00 | 分類號: | G06T1/00;H04N7/173 |
| 代理公司: | 上海申匯專利代理有限公司 | 代理人: | 翁若瑩 |
| 地址: | 200235上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻文件 快速 擇優(yōu) 截圖 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種視頻文件快速擇優(yōu)截圖的方法,可實(shí)現(xiàn)快速地分析各種視頻格式的視頻幀,并從中選擇相對較優(yōu)的視頻幀產(chǎn)生截圖,屬于數(shù)字音視頻處理技術(shù)領(lǐng)域。
背景技術(shù)
隨著寬帶互聯(lián)網(wǎng)的不斷發(fā)展,視頻在互聯(lián)網(wǎng)上面越來越產(chǎn)生重要的影響。從傳統(tǒng)的VOD網(wǎng)站到純粹以UGC用戶分享形式的WEB2.0的播客分享網(wǎng)站,在人們的網(wǎng)絡(luò)生活中占越來越大的比重。而UGC形式的用戶視頻分享的形式是靠用戶自主往分享網(wǎng)站上傳,由用戶自己來編輯節(jié)目信息,發(fā)布節(jié)目內(nèi)容,而發(fā)布過程中由系統(tǒng)進(jìn)行自動(dòng)截圖,產(chǎn)生影片的封面圖片供其他用戶瀏覽是一個(gè)不可或缺的環(huán)節(jié)。
而原有的技術(shù)一般都是通過一些開源的工具隨機(jī)或者固定獲取視頻中某個(gè)時(shí)間點(diǎn)的視頻幀來產(chǎn)生截圖的。這種方法的隨機(jī)性因素非常大,而且經(jīng)常會(huì)出現(xiàn)截取的圖片質(zhì)量比較差的情況,如幾乎完全的黑屏畫面,或者幾乎完全的白屏畫面,導(dǎo)致產(chǎn)生的截圖作為封面圖片對瀏覽的用戶來說幾乎沒有什么意義,用戶體驗(yàn)比較差。譬如目前的一些知名的播客網(wǎng)站都有這個(gè)問題。
當(dāng)然,通過計(jì)算機(jī)對視頻中每個(gè)內(nèi)容的幀信息進(jìn)行分析得出直接針對視頻的內(nèi)容,并且選出一個(gè)內(nèi)容有針對性,有代表性的視頻幀,從技術(shù)角度來說在目前這個(gè)階段是比較困難的。但是通過分析圖像的質(zhì)量,分析其色調(diào)、飽和度等選擇一個(gè)內(nèi)容比較豐滿、色彩比較豐富的畫面還是比較容易做到和可以實(shí)施的。目前確實(shí)也有一些專業(yè)的圖像處理方面的技術(shù)進(jìn)行圖像質(zhì)量的評價(jià),但是算法相對比較復(fù)雜,實(shí)施較困難。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種操作簡單的視頻文件快速擇優(yōu)截圖的方法。為實(shí)現(xiàn)以上目的,本發(fā)明的技術(shù)方案是提供一種視頻文件快速擇優(yōu)截圖的方法,其特征在于,用C++語言編制程序,采用基于DirectShow?SDK,運(yùn)行于MS?Windows平臺(tái),對各種視頻格式進(jìn)行快速擇優(yōu)截圖,其方法為:
第一步.初始化DirectShow的FilterGraph,加載相應(yīng)的視頻文件讀取、音視頻分離Splitter、視頻解碼、視頻幀抓取等DirectShow的篩選器,并將他們相互鏈接上,并在視頻幀提取篩選器上掛接“截圖生成器”,詢問用戶需要處理的視頻,需要生成的截圖的長寬比和截圖生成的文件格式以及截圖的文件名等信息,程序獲取需要處理的視頻文件,需要生成的截圖長寬比,輸出的截圖的圖片格式和文件名后執(zhí)行以下操作;
第二步.根據(jù)視頻文件的視頻總時(shí)長,將視頻根據(jù)需要的掃描粒度劃分若干等份,譬如視頻文件總時(shí)長為3600秒,那么假設(shè)分為20等份,計(jì)算得到視頻幀跳躍定位的步長為3600/20=180秒,如此,每隔180s抓取視頻文件中的那個(gè)時(shí)刻的圖像,而不對所有視頻幀進(jìn)行掃描,以提高掃描速度,并通過調(diào)用FilterGraph的IMediaSeeking接口的SetPositions方法將視頻幀定位到視頻的開始處;
第三步.截圖生成器對當(dāng)前的視頻幀進(jìn)行圖像質(zhì)量的評價(jià),首先將圖像灰度化成256級,并統(tǒng)計(jì)整個(gè)圖像在每個(gè)灰度等級上面的像素分布數(shù)量,這個(gè)像素?cái)?shù)量的分布狀況能夠反映出原始圖像是否存在偏色情況,譬如白屏、黑屏或者藍(lán)屏等情況,灰度等級分布統(tǒng)計(jì)采用以下的方法計(jì)算,用類C語言偽代碼說明:
int?D[256];//D存放圖像灰度等級的分布
初始化數(shù)組D中的每個(gè)值為0;
for(int?x=0;x<圖像的寬度;x++)
{
???for(int?y=0;y<圖像的高度;y++)
???{
??????int?r=圖像在坐標(biāo)為x和y上的點(diǎn)的RGB值中的R分量;
??????int?g=圖像在坐標(biāo)為x和y上的點(diǎn)的RGB值中的G分量;
??????int?b=圖像在坐標(biāo)為x和y上的點(diǎn)的RGB值中的B分量;
??????int?curgray=(B*117+G*601+R)>>10);//像素灰度化
??D[curgray]++;
??}
}
再根據(jù)上面得到的灰度等級分布計(jì)算分布狀況的離散程度。離散度采用以下公式進(jìn)行計(jì)算:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海激動(dòng)通信有限公司,未經(jīng)上海激動(dòng)通信有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810037284.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:織物密度分析設(shè)備
- 下一篇:一種服裝面料預(yù)處理裝置
- 控制鋯鈦酸鉛鐵電薄膜擇優(yōu)取向的方法
- 無線通信系統(tǒng)、無線通信裝置和無線通信方法
- 一種AlN薄膜為中間層的高頻聲表面波器件及制備方法
- 一種粉末衍射擇優(yōu)取向參數(shù)確定方法
- 一種擇優(yōu)生長ITO透明導(dǎo)電薄膜的制備方法
- 一種統(tǒng)籌法各類項(xiàng)目組織多級計(jì)劃體系資源有限優(yōu)化方法
- 一種統(tǒng)籌法任意項(xiàng)目組合資源有限優(yōu)化方法
- 一種統(tǒng)籌法任意項(xiàng)目組合工期制約資源有限優(yōu)化方法
- 一種固體氧化物燃料電池晶面擇優(yōu)暴露的陰極及其制備方法與應(yīng)用
- 一種擇優(yōu)生長的ITO透明導(dǎo)電薄膜的制備方法





