[發(fā)明專利]基于感興趣區(qū)域動態(tài)檢測的場景影像轉(zhuǎn)換系統(tǒng)和方法有效
| 申請?zhí)枺?/td> | 201110021338.1 | 申請日: | 2011-01-19 |
| 公開(公告)號: | CN102611872A | 公開(公告)日: | 2012-07-25 |
| 發(fā)明(設(shè)計)人: | 王曉萌;范圣印;宮衛(wèi)濤;王鑫 | 申請(專利權(quán))人: | 株式會社理光 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;G06K9/00 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 丁辰 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 感興趣 區(qū)域 動態(tài) 檢測 場景 影像 轉(zhuǎn)換 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于感興趣區(qū)域動態(tài)檢測的場景影像轉(zhuǎn)換系統(tǒng)和基于感興趣區(qū)域動態(tài)檢測的場景影像轉(zhuǎn)換方法。
背景技術(shù)
隨著視頻壓縮和視頻增強領(lǐng)域技術(shù)的發(fā)展,遠程視頻系統(tǒng)越來越廣泛地使用。遠程視頻系統(tǒng)的典型代表例如遠程視頻會議系統(tǒng)、遠程醫(yī)療系統(tǒng)等等,其特點是在至少兩個終端分別設(shè)置視頻采集和視頻顯示設(shè)備,通過有線或無線的通信手段將各個終端互聯(lián),以便各個終端的用戶分別獲得對方的實時或離線的視頻。在遠程視頻系統(tǒng)的應(yīng)用中,通過動態(tài)檢測感興趣區(qū)域,將可能的感興趣區(qū)域的場景突出顯示給對方,將顯著提高遠程視頻系統(tǒng)的用戶友好性。
關(guān)于通過動態(tài)檢測感興趣區(qū)域來改變顯示的場景,已經(jīng)提出了以下技術(shù)。
根據(jù)專利文件1(美國專利US?20100103245?A1)提出的技術(shù),動態(tài)檢測感興趣區(qū)域,對感興趣區(qū)域進行最優(yōu)化顯示,而忽略非感興趣區(qū)域的顯示。其中,基于不同的感興趣區(qū)域的內(nèi)容,顯示區(qū)域的尺寸比例可以自動調(diào)整。但是,在專利文件1中,感興趣區(qū)域僅僅限于人臉,也就意味著,圖像的尺寸僅與人臉尺寸成正比,而沒有對視頻會議的場景狀態(tài)進行分類。另一方面,如果感興趣區(qū)域的尺寸比較小,則單純依靠等比例放大,對視頻質(zhì)量有一定限制。
專利文件2(美國專利US?7580054?B2)提供了一種利用全角攝像頭攝制會議并且能夠為用戶提供實時和離線的視頻顯示的技術(shù)。該技術(shù)包含自動的攝像頭管理系統(tǒng)以控制攝像頭、以及分析模塊以定位在場人員。但是,在專利文件2中,需要全角攝像頭或者多個普通攝像頭組成的陣列來提供每個在場人員的影像,在硬件設(shè)備方面,這是很重的負擔。并且,用戶只能在單個人員的影像之間切換,從而可能丟失用戶其它的感興趣區(qū)域的重要信息。
專利文件3(美國專利US?20090015658?A1)利用視頻檢測技術(shù)在攝像頭捕捉到的視頻幀內(nèi)進行在場人員的檢測,然后基于檢測到的在場人員的位置和尺寸信息,自動調(diào)整攝像頭的方位和放縮比例,從而提供一個包含所有在場人員的最佳影像。但是,專利文件3僅提供了包含所有在場人員的影像,在單個在場人員的影像方面有局限性。并且,在專利文件3中,在場人員的離開可以有效地檢測到,但是對于新人員的加入,該專利文件3通過在檢測區(qū)域外進行音頻信息定位,因而也具有一定的局限性。
專利文件4(US?6611281?B2)提供了一種在視頻會議下跟蹤多個在場人員的方法,該方法包括:對視頻會議進行監(jiān)視;生成視頻定位輸出;生成音頻定位輸出;基于視頻和音頻的定位輸出,來調(diào)整攝像頭的參數(shù)。在專利文件4中,顯示僅能在發(fā)言人和全部在場人員的場景影像間切換,僅僅通過對發(fā)言人進行視頻和音頻的檢測和定位,將影像切換至該發(fā)言人。此外,由于專利文件4未能進行感興趣區(qū)域的動態(tài)檢測及轉(zhuǎn)換,并且未提供場景的擴展性,對于人員進入或者離開會議的情況,專利文件4未能提供影像上的自動調(diào)整。
上述相關(guān)技術(shù)的專利文件中提到的技術(shù)都無法始終為視頻會議提供最優(yōu)影像,因為用戶的感興趣區(qū)域在整個會議進程中是變化的。例如,專利文件4只能提供兩種可選的場景影像,未能進行感興趣區(qū)域的動態(tài)檢測及相應(yīng)的場景狀態(tài)轉(zhuǎn)換。專利文件2提供不同的場景影像,但是以硬件的急劇增加為代價,也未能進行感興趣區(qū)域的動態(tài)檢測及相應(yīng)的場景狀態(tài)轉(zhuǎn)換。雖然專利文件1提到了基于感興趣區(qū)域的視頻顯示,然而其定義的感興趣區(qū)域是有限的,且未能對其進行動態(tài)檢測并進行相應(yīng)的場景轉(zhuǎn)換,并且場景視頻影像的視覺質(zhì)量在某些情況下也并不理想。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)中存在的上述問題而做出本發(fā)明。本發(fā)明提出了一種基于感興趣區(qū)域動態(tài)檢測的場景影像轉(zhuǎn)換系統(tǒng)和基于感興趣區(qū)域動態(tài)檢測的場景影像轉(zhuǎn)換方法。
根據(jù)本發(fā)明的一個實施例,提供一種基于感興趣區(qū)域動態(tài)檢測的場景影像轉(zhuǎn)換系統(tǒng),包括:輸入裝置,輸入攝像設(shè)備當前所拍攝的圖像,作為當前幀圖像;檢測裝置,在所述輸入裝置所輸入的所述當前幀圖像中,檢測出全部的興趣元素和潛在元素,以確定所述興趣元素的最大可能存在區(qū)域;狀態(tài)轉(zhuǎn)換裝置,通過預(yù)先定義的有限狀態(tài)自動機,按照所預(yù)先定義的不同場景狀態(tài)及轉(zhuǎn)換條件,在所述最大可能存在區(qū)域的場景狀態(tài)之間轉(zhuǎn)換;以及顯示裝置,根據(jù)狀態(tài)轉(zhuǎn)換裝置所轉(zhuǎn)換的當前場景狀態(tài),從所述最大可能存在區(qū)域中提取出符合該當前場景狀態(tài)的感興趣區(qū)域,來作為場景影像以供顯示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社理光,未經(jīng)株式會社理光許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110021338.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





