[發明專利]一種多媒體采集裝置和方法有效
| 申請號: | 201210283273.2 | 申請日: | 2012-08-09 |
| 公開(公告)號: | CN103581606B | 公開(公告)日: | 2018-09-07 |
| 發明(設計)人: | 孫敏剛;趙照 | 申請(專利權)人: | 北京維鯨視界科技有限公司 |
| 主分類號: | H04N7/14 | 分類號: | H04N7/14;H04N7/15;H04N5/232;G10L15/06 |
| 代理公司: | 北京市隆安律師事務所 11323 | 代理人: | 權鮮枝 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多媒體 采集 裝置 方法 | ||
1.一種多媒體采集裝置,其特征在于,包括:音頻采集單元,包括至少四個采集通道,用于采集發言者的發出的音頻信號;所述各采集通道在幾何平面內均衡設置;音頻分析單元,用于將采集到的發言者的音頻信號中的特征量在預置的語音模型中進行匹配分析,實時定位發言者的位置信息;視頻同步單元,用于根據發言者的位置信息實時調整攝像頭,從而使攝像頭采集含有發言者的視頻信號;
所述預置的語音模型由以下單元構建:音頻預處理單元,用于對各采集通道采集到的全體音頻信號進行降噪,并對降噪后音頻信號中的特征量進行量化;
音頻建模單元,用于對量化后的特征量進行建模,得到語音模型;其中,將同一時刻采集到的各音頻信號中的特征值和發言者的相對位置信息進行結構話存儲;
所述音頻分析單元結合各采集通道對應的音量值進行分析,基于音場均衡策略在語音模型中實時確定發言者的位置信息;
其中,提取發言者的位置信息對應的極坐標系中的偏轉角和極軸長,根據所述偏轉角和極軸長將在PTZ平臺上的攝像頭實時進行調整,調整攝像頭的偏轉角度和焦距,從而使攝像頭清晰地攝取發言者對應的視頻信號;發言者對應的位置信息變化達到一定閾值時才進行攝像頭的調整。
2.根據權利要求1所述的裝置,其特征在于:所述音頻預處理單元接收音頻采集單元采集的音頻信號,并將量化后的特征量發送至音頻建模單元。
3.根據權利要求1所述的裝置,其特征在于:所述語音模型存儲發言者的位移和各通道對應的音量值。
4.根據權利要求1所述的裝置,其特征在于:所述音頻采集單元中的各采集通道以攝像頭為圓心,均勻在圓周上進行設置。
5.一種多媒體采集方法,其特征在于,包括至少四個采集通道,在幾何平面內均衡設置,還包括如下步驟:各采集通道分別采集發言者的發出的音頻信號;將采集到的發言者的音頻信號中的特征量在預置的語音模型中進行匹配分析,實時定位發言者的位置信息;根據發言者的位置信息實時調整攝像頭,從而使攝像頭采集含有發言者的視頻信號;
所述預置的語音模型構建時,對各采集通道采集到的全體音頻信號進行降噪,并對降噪后音頻信號中的特征量進行量化;對量化后的特征量進行建模,得到語音模型;其中,將同一時刻采集到的各音頻信號中的特征值和發言者的相對位置信息進行結構話存儲;
所述音頻分析單元結合各采集通道對應的音量值進行分析,基于音場均衡策略在語音模型中實時確定發言者的位置信息;
其中,提取發言者的位置信息對應的極坐標系中的偏轉角和極軸長,根據所述偏轉角和極軸長將在PTZ平臺上的攝像頭實時進行調整,調整攝像頭的偏轉角度和焦距,從而使攝像頭清晰地攝取發言者對應的視頻信號;發言者對應的位置信息變化達到一定閾值時才進行攝像頭的調整。
6.根據權利要求5所述的方法,其特征在于:所述語音模型存儲發言者的位移和各通道對應的音量值。
7.根據權利要求5所述的方法,其特征在于:所述各采集通道以攝像頭為圓心,均勻在圓周上進行設置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京維鯨視界科技有限公司,未經北京維鯨視界科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210283273.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶TDS檢測的水杯及判斷水杯內飲料的方法
- 下一篇:保溫容器





