[發(fā)明專利]視頻會議裝置與視頻會議管理方法有效
| 申請?zhí)枺?/td> | 201810141603.1 | 申請日: | 2018-02-11 |
| 公開(公告)號: | CN108933915B | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計)人: | 曾羽鴻;陳柏森 | 申請(專利權(quán))人: | 和碩聯(lián)合科技股份有限公司 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;G01S5/18;G06K9/00;G06T3/40;G10L15/08;G10L15/26 |
| 代理公司: | 隆天知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 黃艷 |
| 地址: | 中國臺*** | 國省代碼: | 臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻會議 裝置 管理 方法 | ||
本發(fā)明提供一種視頻會議裝置與對應(yīng)的視頻會議管理方法。所述方法包括接收會議空間內(nèi)所發(fā)出的聲音;根據(jù)所接收到的聲音來判斷所述聲音的第一位置;獲取會議空間的全景影像;識別所述全景影像中的多個與會者的臉部影像,并且識別所述多個臉部影像于所述全景影像中的第二位置;根據(jù)所述第一位置、所述多個第二位置與所述多個臉部影像來判定所述多個與會者中的發(fā)言者;設(shè)定所述全景影像顯示于視頻會議影像的第一區(qū)域,放大所述全景影像中的所判定的所述發(fā)言者的影像,并且設(shè)定所放大的該發(fā)言者的所述影像顯示于所述視頻會議影像的第二區(qū)域。
技術(shù)領(lǐng)域
本發(fā)明涉及一種視頻裝置,且特別涉及一種適用于視頻會議的視頻會議裝置與視頻會議管理方法。
背景技術(shù)
傳統(tǒng)視頻會議系統(tǒng)利用3個以上的攝影機(jī)來拍攝參與會議的人,同時使用麥克風(fēng)陣列來進(jìn)行發(fā)言者的定位,并且將所定位的發(fā)言者放大于視頻會議影像中。然而,傳統(tǒng)作法僅執(zhí)行聲音定位來判斷音源位置,并且認(rèn)為該音源位置即是發(fā)言者的位置,進(jìn)而將該位置的影像放大于視頻會議影像中。因此,上述傳統(tǒng)方法會因?yàn)榄h(huán)境噪音的影像而導(dǎo)致準(zhǔn)確度不足,無法精準(zhǔn)地判斷發(fā)言者的位置。
發(fā)明內(nèi)容
本發(fā)明提供一種視頻會議裝置與視頻會議管理方法,可通過聲音定位與影像識別來準(zhǔn)確且自動地檢測發(fā)言者,以將發(fā)言者的影像放大且顯示于視頻會議影像中。
本發(fā)明的一實(shí)施例提供一種視頻會議裝置。所述裝置包括麥克風(fēng)陣列、聲音定位單元、影像獲取裝置、影像識別單元與視頻會議管理單元。所述麥克風(fēng)陣列包括多個麥克風(fēng),并且用以接收會議空間內(nèi)所發(fā)出的聲音。所述聲音定位單元耦接至所述麥克風(fēng)陣列,并且用以根據(jù)所接收到的所述聲音來判斷所述聲音的第一位置。所述影像獲取裝置用以獲取所述會議空間的全景影像。所述影像識別單元耦接所述影像獲取裝置,用以識別所述全景影像中的至少一個與會者的臉部影像,并且判斷所述至少一個臉部影像的第二位置。所述視頻會議管理單元耦接所述聲音定位單元與所述影像識別單元,并且用以根據(jù)所述第一位置、所述至少一個第二位置與所述至少一個臉部影像來判定所述至少一個與會者中的發(fā)言者。此外,所述視頻會議管理單元設(shè)定所述全景影像顯示于視頻會議影像的第一區(qū)域,放大所述全景影像中的所判定的所述發(fā)言者的影像,并且設(shè)定所放大的所述發(fā)言者的所述影像顯示于所述視頻會議影像的第二區(qū)域。
在上述的實(shí)施例中,所述視頻會議管理單元對所述發(fā)言者所發(fā)出的所述聲音進(jìn)行語音轉(zhuǎn)文字操作,以將所述發(fā)言者的所述聲音轉(zhuǎn)換為對應(yīng)所述發(fā)言者的文字信息,其中所述視頻會議管理單元存儲對應(yīng)該發(fā)言者的識別名稱與所述文字信息至?xí)h記錄數(shù)據(jù)庫。
本發(fā)明的一實(shí)施例提供一種視頻會議管理方法,適用于在會議空間所進(jìn)行的視頻會議,其中所述會議空間具有至少一個與會者。所述方法包括接收所述會議空間內(nèi)所發(fā)出的聲音;根據(jù)所接收到的所述聲音來判斷所述聲音的第一位置;獲取所述會議空間的全景影像;識別所述全景影像中的所述至少一個與會者的臉部影像,并且判斷所述至少一個臉部影像的第二位置;根據(jù)所述第一位置、所述至少一個第二位置與所述至少一個臉部影像來判定所述至少一個與會者中的發(fā)言者;以及設(shè)定所述全景影像顯示于視頻會議影像的第一區(qū)域,放大所述全景影像中的所判定的所述發(fā)言者的影像,并且設(shè)定所放大的該發(fā)言者的所述影像顯示于所述視頻會議影像的第二區(qū)域。
在上述的實(shí)施例中,所述視頻會議管理單元對所述發(fā)言者所發(fā)出的所述聲音進(jìn)行語音轉(zhuǎn)文字操作,以將所述發(fā)言者的所述聲音轉(zhuǎn)換為對應(yīng)所述發(fā)言者的文字信息,其中所述視頻會議管理單元存儲對應(yīng)該發(fā)言者的識別名稱與所述文字信息至?xí)h記錄數(shù)據(jù)庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于和碩聯(lián)合科技股份有限公司,未經(jīng)和碩聯(lián)合科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810141603.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 視頻會議控制方法、系統(tǒng)、視頻會議網(wǎng)絡(luò)設(shè)備和會場
- 視頻會議的控制方法和視頻會議系統(tǒng)
- 視頻會議系統(tǒng)及多方視頻會議轉(zhuǎn)換方法
- 一種控制視頻會議的方法及視頻會議系統(tǒng)
- 視頻會議的實(shí)現(xiàn)方法、接入方法及相應(yīng)裝置
- 一種視頻會議管理系統(tǒng)和方法
- 跨用戶域視頻會議的實(shí)現(xiàn)方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 一種視頻會議控制方法、多點(diǎn)控制單元及視頻會議終端
- 基于車載終端的視頻會議建立方法、系統(tǒng)、存儲介質(zhì)、車載終端
- 一種視頻會議協(xié)同方法、電子設(shè)備及計算機(jī)可讀存儲介質(zhì)





