[發(fā)明專(zhuān)利]一種多媒體會(huì)議中分布式混音系統(tǒng)無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200710067913.5 | 申請(qǐng)日: | 2007-03-31 |
| 公開(kāi)(公告)號(hào): | CN101252452A | 公開(kāi)(公告)日: | 2008-08-27 |
| 發(fā)明(設(shè)計(jì))人: | 宋旭東;杜武平 | 申請(qǐng)(專(zhuān)利權(quán))人: | 紅杉樹(shù)(杭州)信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | H04L12/18 | 分類(lèi)號(hào): | H04L12/18;H04M3/56;G10K15/08 |
| 代理公司: | 浙江杭州金通專(zhuān)利事務(wù)所有限公司 | 代理人: | 徐關(guān)壽 |
| 地址: | 310012浙江省杭州市天*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多媒體 會(huì)議 分布式 音系 | ||
1.一種多媒體會(huì)議中分布式混音系統(tǒng),該混音系統(tǒng)包括語(yǔ)音主服務(wù)器、語(yǔ)音子服務(wù)器以及客戶(hù)端,所述的客戶(hù)端連接語(yǔ)音子服務(wù)器、所述語(yǔ)音子服務(wù)器連接語(yǔ)音主服務(wù)器,所述的客戶(hù)端包括:
語(yǔ)音采集模塊,用于在與會(huì)者說(shuō)話時(shí),傳送通話過(guò)程中交談的音頻數(shù)據(jù)流;
語(yǔ)音發(fā)送模塊,用于將采集的音頻數(shù)據(jù)流通過(guò)傳輸協(xié)議對(duì)語(yǔ)音幀打包發(fā)送到語(yǔ)音子服務(wù)器;
其特征在于:
所述的語(yǔ)音主服務(wù)器與語(yǔ)音子服務(wù)器呈樹(shù)狀形的網(wǎng)絡(luò);
所述的客戶(hù)端還包括:
信號(hào)能量計(jì)算模塊,用于在采集到音頻數(shù)據(jù)流之后,計(jì)算信號(hào)能量E,音頻數(shù)據(jù)流的當(dāng)前幀的能量E可由以下公式(1)計(jì)算獲得:
式中,{s[n]}n=0,...,N-1表示音頻數(shù)據(jù)流的輸入信號(hào);
語(yǔ)音幀的短時(shí)平均能量Energy由相鄰兩幀的信號(hào)能量E1和E2計(jì)算得出:
Energy=(E1+E2)/2????????(2);
在語(yǔ)音發(fā)送模塊中,將平均能量存儲(chǔ)到打包發(fā)送的語(yǔ)音幀的擴(kuò)展位;
混音模塊,用于接收語(yǔ)音子服務(wù)器回傳的終選的音頻數(shù)據(jù),送入抖動(dòng)緩沖區(qū)隊(duì)列(Jitter?Buffers),經(jīng)過(guò)解碼器解碼后送入語(yǔ)音幀緩沖區(qū)隊(duì)列,定時(shí)激活混音算法處理程序,混音算法處理程序從每列語(yǔ)音幀緩沖區(qū)中提取最早到達(dá)的語(yǔ)音幀,做語(yǔ)音信號(hào)混音處理,混音公式表示為(6):
其中,{input[j][i]}i=0,...,N-1表示第J列語(yǔ)音流所包括的語(yǔ)音幀,經(jīng)解碼后得到的語(yǔ)音輸入信號(hào);混音處理后的輸出結(jié)果被放到mixing[i],M表示語(yǔ)音流的總數(shù);
處理完畢送到播放緩沖區(qū)隊(duì)列等待回放;
所述的語(yǔ)音子服務(wù)器包括:
語(yǔ)音接收模塊,用于接收來(lái)自作為發(fā)言者的客戶(hù)端的音頻數(shù)據(jù)流,并解析語(yǔ)音幀的擴(kuò)展位,獲得各音頻數(shù)據(jù)流當(dāng)前幀的短時(shí)平均能量Energy;初選模塊,用于比較各音頻數(shù)據(jù)流的平均能量大小,根據(jù)設(shè)定的語(yǔ)音流的總數(shù),選中平均能量最大的音頻數(shù)據(jù)流作為初選結(jié)果;
所述的語(yǔ)音主服務(wù)器包括:
語(yǔ)音接收模塊,用于接收來(lái)自各個(gè)語(yǔ)音子服務(wù)器初選完成的音頻數(shù)據(jù)流,解析語(yǔ)音幀的擴(kuò)展位,獲得各音頻數(shù)據(jù)流當(dāng)前幀的短時(shí)平均能量Energy;語(yǔ)音活動(dòng)度量計(jì)算模塊,用于計(jì)算音頻數(shù)據(jù)流的語(yǔ)音活動(dòng)度量ψ,其算式為(3):
ψ=α1A1+α2A2????(3)
其中A1為當(dāng)前語(yǔ)音活動(dòng),A2為上一次活動(dòng);
A1由矩形窗W1計(jì)算獲得,如下形式(4):
其中,W1即最近語(yǔ)音序列的時(shí)間段,tp表示當(dāng)前的時(shí)間段,即當(dāng)前的矩形窗長(zhǎng)度;
A2由矩形窗口W2計(jì)算得出,表示成(5):
其中,W2即上上個(gè)語(yǔ)音序列的時(shí)間段;終選模塊,用于比較各音頻數(shù)據(jù)流的語(yǔ)音活動(dòng)度量ψ大小,根據(jù)設(shè)定的語(yǔ)音流的總數(shù),選中語(yǔ)音活動(dòng)度量ψ最大的音頻數(shù)據(jù)流作為終選結(jié)果;音頻轉(zhuǎn)發(fā)模塊,用于將終選得到的音頻數(shù)據(jù)轉(zhuǎn)發(fā)到客戶(hù)端。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于紅杉樹(shù)(杭州)信息技術(shù)有限公司,未經(jīng)紅杉樹(shù)(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710067913.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種實(shí)現(xiàn)視頻會(huì)議資源調(diào)度的方法
- 一種會(huì)議系統(tǒng)的實(shí)現(xiàn)方法
- 視頻會(huì)議跨級(jí)控制方法及系統(tǒng)
- 一種用應(yīng)用服務(wù)器實(shí)現(xiàn)子會(huì)議功能的方法和系統(tǒng)
- 一種通過(guò)互動(dòng)式語(yǔ)音應(yīng)答接入會(huì)議的方法及系統(tǒng)
- 基于SIP協(xié)議的分布式會(huì)議方法
- 會(huì)議控制方法和裝置
- 待召開(kāi)會(huì)議的會(huì)議議程生成方法以及裝置
- 會(huì)議控制方法和裝置
- 會(huì)議流程的管理方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器





