[發(fā)明專利]視頻會議系統(tǒng)、處理裝置及視頻會議方法無效
| 申請?zhí)枺?/td> | 201610120613.8 | 申請日: | 2016-03-03 |
| 公開(公告)號: | CN105592268A | 公開(公告)日: | 2016-05-18 |
| 發(fā)明(設計)人: | 韋國華;陳冬根 | 申請(專利權)人: | 蘇州科達科技股份有限公司 |
| 主分類號: | H04N5/232 | 分類號: | H04N5/232;H04N5/265;H04N7/15 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 臧云霄;李峰 |
| 地址: | 215011 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻會議系統(tǒng) 處理 裝置 視頻會議 方法 | ||
技術領域
本發(fā)明涉及視頻會議領域,尤其涉及一種視頻會議系統(tǒng)、處理裝置及視 頻會議方法。
背景技術
傳統(tǒng)的視頻會議系統(tǒng)中,當多方進行會議時,尤其是當一個會議室里有 多人參加會議,并發(fā)言時,實際的會議畫面無法在聚焦于實際的發(fā)言人身上, 其他與會各方無法實時、清晰的看到發(fā)言人的舉止和表情。而與會各方通常 都有與發(fā)言人進行溝通、交流和對話需求,并且通常都希望能將畫面聚焦到 發(fā)言人身上,并有一種面對面的感覺。
在這樣的需求下,各種手動、自動的發(fā)言人跟蹤、定位的系統(tǒng)與方法也 應運而生。然而現有的一些系統(tǒng)在整套會議系統(tǒng)的部署上通常存在諸多問題, 如:需要為每個人設置一個預置位,講話前必須按發(fā)言鍵,話筒的位置需要 固定等等。這都為整個系統(tǒng)的設置和最終會議的進行帶來了各種各樣的約束 和限制,甚至極大的降低和損失了視頻會議的友善性,交互性和體驗度。
另有其他一些現有技術,利用一個攝像頭來對整個會議場所內的發(fā)言人 進行定位和跟蹤,但在系統(tǒng)實際運行的過程中常常會因僅關注于小范圍內的 畫面,都無法及時顧及整個會議場所內的一些情景及變化,從而易導致對一 些特殊場景下的變化無法作出必要的反應或者反應不夠及時。
發(fā)明內容
本發(fā)明為了克服上述現有技術存在的缺陷,提供了一種視頻會議系統(tǒng)、 處理裝置及視頻會議方法,其能夠顧及整個視頻會議場所中的情景變化。
根據本發(fā)明的一個方面,提供一種處理裝置,應用于視頻會議系統(tǒng)。所 述視頻會議系統(tǒng)包括第一攝像機、第二攝像機以及麥克風矩陣,所述處理裝 置包括:音源定位模塊,用于根據所述麥克風矩陣所采集的音頻確定第一音 源以及至少一個第二音源所在方向,所述第一音源為持續(xù)音源,所述第二音 源為動態(tài)音源;第一控制模塊,用于控制所述第一攝像機轉向第一音源所在 方向,并指示所述第一攝像機采集第一音源所在方向的第一視頻數據;第一 截取模塊,用于獲取所述第二攝像機采集的全景視頻數據,并根據所述第二 音源所在方向在所述全景視頻數據中截取對應于至少一個所述第二音源所在 方向的至少一個第二視頻數據;合成模塊,用于將所述第一視頻數據和至少 一個所述第二視頻數據合成到合成畫面中。
優(yōu)選地,所述處理裝置還包括:語音識別模塊,用于根據所述麥克風矩 陣所采集的音頻識別來自不同發(fā)言人的所述第一音源以及至少一個所述第二 音源。
優(yōu)選地,所述處理裝置還包括:切換模塊,用于:當所述語音識別模塊 未識別到所述第一音源和所述第二音源時,指示所述處理裝置輸出全景視頻 數據;當所述語音識別模塊識別到所述第一音源但未識別到所述第二音源時, 指示所述處理裝置輸出第一視頻數據;當所述語音識別模塊識別到所述第一 音源和至少一個所述第二音源時,指示所述處理裝置輸出所述合成畫面。
優(yōu)選地,所述合成模塊還用于根據所述第二視頻數據的數量將所述第一 視頻數據和所述第二視頻數據布局在所述合成畫面中。
優(yōu)選地,所述第一視頻數據在所述合成畫面中所占比例大于任一個所述 第二視頻數據在所述合成畫面中所占比例。
優(yōu)選地,所述第一音源的音量大于第一閾值,并且所述第一音源大于第 一閾值的持續(xù)時間大于第二閾值;以及所述第二音源在所述第一音源大于第 一閾值的持續(xù)時間內大于第三閾值,并且所述第二音源大于第三閾值的持續(xù) 時間小于第四閾值。
優(yōu)選地,所述處理裝置還包括:人臉識別模塊,用于對所述第一視頻數 據及所述全景視頻數據進行人臉識別,并根據所述第一視頻數據獲取與所述 第一音源對應的第一發(fā)言人的位置。
優(yōu)選地,所述處理裝置還包括:定位校正模塊,用于根據所述全景視頻 數據對所述第一視頻數據中的所述第一發(fā)言人的位置進行校正。
優(yōu)選地,所述處理裝置還包括:運動跟蹤模塊,用于對所述第一視頻數 據中的所述第一發(fā)言人進行運動檢測跟蹤;所述第一控制模塊還用于根據所 述運動跟蹤模塊控制所述第一攝像機追蹤所述第一發(fā)言人。
優(yōu)選地,所述處理裝置還包括:運動檢測模塊,用于對所述全景視頻數 據中的除所述第一發(fā)言人外的人員進行運動檢測;以及第二截取模塊,用于 獲取所述第二攝像機采集的全景視頻數據,并在所述全景視頻數據截取第三 視頻數據,所述第三視頻數據包括除所述第一發(fā)言人外的人員移動的圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州科達科技股份有限公司,未經蘇州科達科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610120613.8/2.html,轉載請聲明來源鉆瓜專利網。





