[發(fā)明專利]一種混音方法及多點控制服務器有效
| 申請?zhí)枺?/td> | 201210122891.9 | 申請日: | 2012-04-24 |
| 公開(公告)號: | CN103379424A | 公開(公告)日: | 2013-10-30 |
| 發(fā)明(設計)人: | 劉智輝 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | H04S3/00 | 分類號: | H04S3/00;H04S7/00 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 方法 多點 控制 服務器 | ||
技術領域
本發(fā)明涉及通信領域,尤其涉及一種混音方法及多點控制服務器。
背景技術
視頻會議是現(xiàn)代通信中常用的一種信息交互手段。在視頻會議系統(tǒng)中參加會議的各個會場通過會場終端把本會場的語音數(shù)據(jù)發(fā)送給多點控制服務器如MCU(Multipoint?Control?unit,多點控制單元),MCU對接收到的語音數(shù)據(jù)進行處理,并把處理后的語音數(shù)據(jù)發(fā)送給其他會場終端,使得其他會場終端播放接收到的處理后的語音數(shù)據(jù),從而實現(xiàn)視頻會議中的語音通信。
現(xiàn)有技術中,MCU支持的會場語音聲道有單聲道、雙聲道、三聲道。在視頻通信的過程中,由于發(fā)送會場發(fā)送的語音數(shù)據(jù)的語音聲道數(shù)與接收該語音數(shù)據(jù)的接收會場的語音聲道數(shù)不同,故MCU需要對接收到的語音數(shù)據(jù)進行混音處理,將發(fā)送會場的M聲道語音數(shù)據(jù)混音成接收會場的N聲道語音數(shù)據(jù)。其中,若M大于N則為下混,若M小于N則為上混。根據(jù)REC.ITU_R?BS.775-1的混音方法處理如下:其中L表示左聲道,R表示右聲道、C表示中間聲道、Mono表示單聲道;
下混:三聲道→雙聲道:L+0.7071*C→L,R+0.7071*C→R;
三聲道→單聲道:Mono=0.7071*L+0.7071*R+C;
雙聲道→單聲道:L+R→Mono;
上混:單聲道→雙聲道:0.7071*Mono→L,0.7071*Mono→R;
雙聲道→三聲道:L→L,C=0,R→R;
單聲道→三聲道:Mono→C。
上述視頻會議的實際會場的示意圖如圖1所示,會場中布置有麥克風1~16(圖1中的為所標識的麥克風的位置),用來拾取會場中的語音,揚聲器L、揚聲器C、揚聲器R分別用來播放接收的語音。若所述會場為單聲道語音會場,則會場終端通過麥克風1~16拾取單聲道語音發(fā)送出去,并使用揚聲器C來播放接收的語音;若所述會場為雙聲道語音會場,會場有兩個拾音區(qū),會場終端通過麥克風1~3、7~11來拾取左聲道的語音,通過麥克風4~6、12~16來拾取右聲道的語音,并使用揚聲器L來播放接收到的、已經過混音處理的左聲道語音,用揚聲器R來播放接收到的、已經過混音處理的右聲道語音,同理,會場為三聲道語音會場時,會場有三個拾音區(qū),分別用揚聲器L、揚聲器C、揚聲器R來播放接收到的、已經過混音處理的左、中、右等三個聲道語音。
在實現(xiàn)上述混音的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術中至少存在如下問題:在下混的時候,如果只有一個人在講話,而各個麥克風拾取的是一個人的聲音,由于麥克風離發(fā)言人的距離不同,多聲道中各聲道的語音數(shù)據(jù)信號就有不同程度的延遲,這些延遲時間不同的信號疊加在一起,會引入梳狀效應(所述梳妝效應為延遲時間不同的幾個信號疊加后出現(xiàn)的在某些頻率上信號加強,在某些頻率上信號減弱的效應),導致聲音變混濁,清晰度下降。
或者,在上混或下混的時候,沒有考慮實際聲源的方位,導致聲相不準,即發(fā)言人的聲音輸出方位和該發(fā)言人的圖像呈現(xiàn)方位不一致,例如,圖1所示的會場中,有位于麥克風3和6方位的兩個說話人,他們說出的語音分別作為左聲道語音和右聲道語音發(fā)送給MCU,若播放所述語音的會場為三聲道會場,根據(jù)上述的上混方法,位于麥克風3方位的說話人的語音將從三聲道會場中的揚聲器L中播放出來,即說話人在中間位置,用戶聽到的聲音卻在左邊,影響用戶的體驗質量。
發(fā)明內容
本發(fā)明的實施例提供一種混音方法及裝置,可以提升多聲道混合會議的混音效果,提高用戶體驗。
為達到上述目的,本發(fā)明的實施例采用如下技術方案:
一種混音方法,包括:
獲取M聲道中各聲道的語音數(shù)據(jù)及聲源信息;所述聲源信息包括所述M聲道中L個聲源對應的聲道以及L個聲源的方位信息;其中,M≥1;L≥1,L≤M;
根據(jù)所述L個聲源的方位信息查詢方位系數(shù)對照表,以獲得所述L個聲源的方位信息分別對應的混音系數(shù);
按照所述L個聲源的方位信息對應的混音系數(shù),將所述M聲道中L個聲源對應的聲道的語音數(shù)據(jù)混音成N聲道的語音數(shù)據(jù);其中,N≥1。
一種多點控制服務器,包括:
獲取單元,用于獲取M聲道中各聲道的語音數(shù)據(jù)及聲源信息;所述聲源信息包括所述M聲道中L個聲源對應的聲道以及L個聲源的方位信息;其中,M≥1;L≥1,L≤M;
混音系數(shù)查詢單元,用于根據(jù)所述L個聲源的方位信息查詢方位系數(shù)對照表,以獲得所述L個聲源的方位信息分別對應的混音系數(shù);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210122891.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有多重彈簧減震的跑步機
- 下一篇:一種消防水帶運輸鋪設背包





