[發(fā)明專利]基于視頻內(nèi)容分析的3D視頻搜索引擎的實現(xiàn)方法有效
| 申請?zhí)枺?/td> | 201410213424.6 | 申請日: | 2014-05-20 |
| 公開(公告)號: | CN103970885B | 公開(公告)日: | 2017-01-25 |
| 發(fā)明(設(shè)計)人: | 蘇生;陳倬 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04N19/597 |
| 代理公司: | 成都宏順專利代理事務(wù)所(普通合伙)51227 | 代理人: | 周永宏 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 視頻 內(nèi)容 分析 搜索引擎 實現(xiàn) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于視頻檢索技術(shù)領(lǐng)域,具體涉及一種基于視頻內(nèi)容分析的3D視頻搜索引擎實現(xiàn)方法的設(shè)計。
背景技術(shù)
3D電影《阿凡達》的巨大成功,給3D視頻領(lǐng)域帶來了巨大的發(fā)展。3D顯示技術(shù)日漸成熟,觀影效果越來越好,3D視頻得到了消費者廣泛的認可。3D視頻利用雙眼視差原理,讓觀眾的左眼和右眼獲得獨立的影像,從而獲得三維的空間感。為了形成視差,3D視頻至少包含兩路影像。多視點編碼(Multiview Video Coding,MVC)技術(shù)是3D視頻編碼的標準技術(shù),2009年3月作為H.264標準擴展編碼的附件H由聯(lián)合視頻編碼組(JVT)正式提出。視頻技術(shù)的推廣是一個非常漫長的過程,需要考慮如何利用現(xiàn)有硬軟件設(shè)備,再平滑過渡到新的技術(shù)實施標準。MVC技術(shù)的普及還需要一個漫長的過長,為了兼容現(xiàn)有軟件系統(tǒng)采,目前3D視頻大都采用的普通視頻的編碼,通過將視頻幀經(jīng)過時間復(fù)用或空間復(fù)用的技術(shù)的處理來保存兩路影像。
目前的視頻搜索引擎是利用使用視頻元數(shù)據(jù)(包括視頻標題、標簽和描述等結(jié)構(gòu)化的文本信息)來檢索視頻,實質(zhì)上使用的是文本檢索技術(shù),所以并不能識別出3D視覺特征。對于MVC編碼的3D視頻,可以通過編碼分析很容易地識別出3D信息。但是對于普通編碼的3D視頻,目前還沒有從視頻內(nèi)容上準確識別的方法。用普通視頻搜索引擎或者全文搜索引擎來搜索3D視頻,存在著兩個缺陷。一是準確率低,對于視頻搜索引擎來說,視頻元數(shù)據(jù)包含“3D”或“立體”關(guān)鍵詞的視頻不一定是3D視頻,對于全文搜索引擎來說,搜索結(jié)果中存在著大量非視頻結(jié)果。二是召回率低,因為有的3D視頻沒有被人工添加“3D”相關(guān)的文本描述,則無法基于文本檢索的搜索引擎檢索。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提出一種基于視頻內(nèi)容分析的3D視頻搜索引擎的實現(xiàn)方法,克服傳統(tǒng)搜索引擎在3D視頻搜索上的不足。
本發(fā)明解決其技術(shù)問題采用的技術(shù)方案是:基于視頻內(nèi)容分析的3D視頻搜索引擎的實現(xiàn)方法,具體包括:
步驟1:通過網(wǎng)絡(luò)爬蟲視頻網(wǎng)頁,解析視頻網(wǎng)頁獲取視頻地址,下載視頻樣本;
步驟2:對所述步驟1下載的視頻樣本進行3D識別,若該視頻樣本為MVC編碼格式,則保存該視頻網(wǎng)頁地址,進入步驟3;否則提取該視頻的關(guān)鍵幀,分析該幀畫面是否為3D格式,若為3D格式則進入步驟3,否則取出下一個視頻樣本再從頭執(zhí)行步驟2;
步驟3:將所述步驟2中被識別為3D視頻的網(wǎng)頁保存,并將視頻按照相似度進行聚類,建立搜索引擎的索引。
進一步的,所述通過網(wǎng)絡(luò)爬蟲視頻網(wǎng)頁的具體過程為:利用HtmlUnit瀏覽器程序,模擬圖形瀏覽器訪問網(wǎng)頁,運行網(wǎng)頁的腳本代碼,獲取網(wǎng)頁的動態(tài)數(shù)據(jù),分析數(shù)據(jù)獲取結(jié)果列表,模擬點擊“下一頁”獲取搜索頁面的下一頁,如果頁面不再包含“下一頁”按鈕,則認為本次搜索的結(jié)果已被找完。
進一步的,所述步驟2中分析關(guān)鍵幀畫面是否為3D格式的具體過程中,該3D格式包括拼接格式和色差格式,所述拼接格式指將左右兩路影像直接左右拼接或者上下拼接形成的3D視頻格式,所述色差格式是指將左右兩路影像分別存儲于不同的RGB顏色通道形成的3D視頻格式。
更進一步的,所述拼接格式的識別過程為:
步驟21:將幀圖像分割為左右兩部分,計算左右兩部分的距離Dist1,如果距離Dist小于閥值TH1,則判斷該圖像為左右拼接格式的圖像,結(jié)束流程,否則進入步驟22;
其中,所述H表示一維直方圖數(shù)組,L表示該數(shù)組的長度,k的取值范圍為1~L,表示將整個圖像明度劃分為L階后的第k階明度,H1(k)表示左半部分圖像對應(yīng)的直方圖數(shù)組,H2(k)表示表示右半部分圖像對應(yīng)的直方圖數(shù)組;
步驟22:將幀圖像分割為上下兩部分,計算上下兩部分的距離Dist2,如果距離Dist2小于閥值TH2,則判斷該圖像為上下拼接格式的圖像,結(jié)束流程,否則進入步驟23;
其中,所述H3(k)表示上半部分圖像對應(yīng)的直方圖數(shù)組,H4(k)表示下半部分圖像對應(yīng)的直方圖數(shù)組;
步驟23:計算幀圖像的邊緣圖像,在寬度為W的中央部分取出連續(xù)的W列像素,其中一列的黑色像素數(shù)目占該列像素總數(shù)的百分比δ以上,則認為存在垂直的拼縫,則判斷該圖像左右拼接格式的圖像,結(jié)束流程,否則進入步驟24;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410213424.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種滅鼠定量投餌器
- 下一篇:一種高效密集型棚架跟蹤式光伏發(fā)電裝置
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





