[發明專利]一種視頻或圖像視點類型的識別方法有效
| 申請號: | 201310057656.2 | 申請日: | 2013-02-22 |
| 公開(公告)號: | CN103198294A | 公開(公告)日: | 2013-07-10 |
| 發明(設計)人: | 桂海田;劉禮豐 | 申請(專利權)人: | 廣州市朗辰電子科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 楊曉松 |
| 地址: | 510663 廣東省廣州市科學*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 圖像 視點 類型 識別 方法 | ||
技術領域
本發明涉及視頻處理與識別研究領域,特別涉及一種視頻或圖像視點類型的識別方法。
背景技術
隨著顯示技術和數字多媒體技術的發展,人們越來越傾向于真實的視覺體驗,立體顯示技術被看作是下一代顯示技術,立體顯示是利用人的左右眼觀看到的場景具有一定的視差而形成3D模型,進而感受到物體具有遠近之分,像是真實的立體場景。目前3D顯示器可以顯示2個、8個、9個等各種視點視頻的視頻源,有些3D顯示器甚至可以對2D/3D進行切換。視頻種類多樣,極大的豐富了3D世界,快速的推動3D顯示技術的應用。
2D平面顯示是現在視頻的主流,對于3D顯示器而言,兼容2D無疑是明智的選擇,兩視點即左右圖格式視頻源,包括各種偏振光形式,紅藍形式是目前各種3D顯示器的主流視頻格式,能較輕易的實現,用戶只需要帶著紅藍眼鏡就能看到3D效果,但此類視頻需要戴著眼鏡,體驗效果相對較差,也只能是從單一的角度看到立體效果,相對而言,8視點、9視點等格式的多視點技術是未來發展的主要方向,能在裸眼3D上展示出較好的效果,對于未來的立體顯示設備,如果能夠全部兼容2D、兩視點、多視點則其應用范圍將大大擴大。對此,如何能快速智能地識別各種視頻源,從而做出相應的排圖顯示,無疑是非常重要的。
對此,目前的視頻格式還沒有形成統一的標準,因此視頻格式的自動識別成了一個難題,已有的方法有通過加入額外的識別碼進行識別等,但是由于不同視點的視頻排圖格式不同,同時不同公司的內部規則也不盡相同,因此效率較低,操作復雜,不能形成一個統一的標準。
因此,能夠針對各視點不同的視頻進行自動識別成為一個極具實際研究意義的課題。
發明內容
本發明的主要目的在于克服現有技術的缺點與不足,提供一種視頻或圖像視點類型的識別方法,該識別方法能夠根據圖像相似度和排圖規則的不同對所有類型的2D/3D視頻源的類型進行識別,識別效率高,準確性高。
本發明的目的通過以下的技術方案實現:一種視頻或圖像視點類型的識別方法,包括以下步驟:
(1)預先通過訓練獲得直方圖相關性閾值、區域相似性特征值閾值;
(2)對于輸入的視頻或圖像,根據排圖規則提取出需要檢測相似性的兩個區域;
(3)對這兩個區域先進行直方圖相似性特征值提取,如果該特征值大于直方圖相關性閾值,則說明兩個區域相似,然后進入步驟(5);如果否,進入步驟(4);
(4)將這兩個區域均對應分為若干塊,兩個區域對應的每一塊之間進行宏塊似然率提取,將兩個區域中所有對應塊的宏塊似然率求平均作為區域相似性特征值,與區域相似性特征值閥值比較,如果小于閥值則判定此兩個區域相似,否則判定是不相似,然后進入步驟(5);
(5)判斷結束,重回步驟(2),繼續根據排圖規則提取出需要檢測相似性的兩個區域,直到判斷出視頻或圖像的視點類型。
具體的,所述步驟(1)中,直方圖相關性閾值、區域相似性特征值閾值均可以通過大量的實驗或根據實際操作經驗進行設定,但是為了盡量避免人為的參與,減少對操作人員的依賴性,可以采用如下的獲取過程得到。
所述步驟(1)中,直方圖相關性閾值的獲取過程如下:
(1-1-1)建立訓練數據庫,訓練數據庫中包括相似圖像組和非相似圖像組,相似圖像組為屬于同一場景的不同視點的圖像組,非相似圖像組為不是同一場景的兩個圖像序列;初始化閾值K1、K2,K1>K2;
(1-1-2)對數據庫中已知是否相似的兩幅圖像進行直方圖相似性特征值提取,記為r2;如果訓練用兩幅圖像為相似圖像,且r2<K1,則將r2賦值給閾值K1,如果訓練用兩幅圖像為非相似圖像,且r2>K2,則將r2賦值給閾值K2;
(1-1-3)重復步驟(1-1-2),直到數據庫中樣本數據訓練結束,得到最終的K1′和K2';
(1-1-4)對最后得到的閾值K1'和K2'之間的值進行訓練,采用訓練數據庫中已知是否相似的兩幅圖像進行判斷,判斷準確率最高的值K即為單個訓練最優閥值。
所述步驟(1)中,區域相似性特征值閾值的獲取過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州市朗辰電子科技有限公司,未經廣州市朗辰電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310057656.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





