[發明專利]數字電話會議的橋路運算方法無效
| 申請號: | 200910103824.0 | 申請日: | 2009-05-11 |
| 公開(公告)號: | CN101557443A | 公開(公告)日: | 2009-10-14 |
| 發明(設計)人: | 黃河清;高世幸;廖紅云 | 申請(專利權)人: | 重慶金美通信有限責任公司 |
| 主分類號: | H04M3/56 | 分類號: | H04M3/56 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 | 代理人: | 侯懋琪 |
| 地址: | 400030重*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數字 電話會議 運算 方法 | ||
1.一種數字電話會議的橋路運算方法,其特征在于:采用時延抖動處理機制對多網段碼流整形;采用單幀檢測與長時窗檢測相結合的VAD語音激活檢測和采樣率匹配算法,減少進入橋路運算的無效通道數并降低運算誤判率;采用短時幅度和運算及漏斗混音運算,降低運算量;
該方法步驟如下:系統對接收到的不同網段信號:1)進行FIFO緩沖,2)解碼,3)單幀檢測與長時窗檢測相結合的VAD語音激活檢測,4)采樣率匹配,5)短時幅度和計算,6)橋路運算,7)采樣率還原,8)漏斗混音運算,9)系統發送端每10ms對各通道送出均勻、連續的10ms碼流量;橋路運算周期10ms;
所述漏斗混音運算包括:在10ms單位橋路處理周期內,由步驟5)對各通道進行短時幅度和計算,得出短時幅度和最大通道及短時幅度和第二大通道,將短時幅度和第二大通道的話音信息送給發言者通道,將短時幅度和最大通道話音信息發送給其他所有參會通道;
所述單幀檢測與長時窗檢測相結合的VAD語音激活檢測,包括:從各個通道解碼后的語音幀中提取4種語音特征參數,根據4種語音特征參數與對應的背景噪聲的運行平均值的差值構造判據,根據判據進行單幀檢測,根據單幀檢測結果進行長時窗檢測,根據長時窗檢測結果確定該通道狀態;
前述4種語音特征參數為:
線譜頻率:{LSFi},i=1,…10,由線性預測分析得到的一組線譜頻率LSF系數;
全帶能量:?其中R(0)為輸入語音的第一個自相關系數,N=240為LPC分析窗的長度;
子帶能量:?該子帶能量是指輸入語音在0-1kHz頻段的能量,其中h為截止頻率1khz的FIR濾波器的沖擊響應,R為13階托伯里茲自相關系數矩陣;
歸一過零率:其中{x(i)}為輸入語音信號,i為序數,M=80為編碼的幀長度;
4種語音特征參數與對應的背景噪聲的運行平均值的差值構造出的判據如下:
1)如果ΔS>a1ΔZCR+b1那么IVD=1;
2)如果ΔS>a1ΔZCR+b2那么IVD=1;
3)如果ΔEf<a3ΔZCR+b3那么IVD=1;?
4)如果ΔEf<a4×ΔZCR+b4那么IVD=1;
5)如果ΔEf<b5那么IVD=1;
6)如果ΔEf<a6×ΔS+b6那么IVD=1;
7)如果ΔS>b7那么IVD=1;
IVD=1表示當前語音通道為激活狀態;IVD=0表示當前語音通道為非激活狀態;
其中,
LSFi為語音特征參數中的線譜頻率;Ef為語音特征參數中的全帶能量;為語音特征參數中的子帶能量;ZCR為語音特征參數中的歸一過零率;
為:分別與前述4種語音特征參數對應的背景噪聲的運行平均值,此運行平均值分別為4種語音特征參數在前32幀的平均值;
前述14個判據中的常量取值見下表:?
判據處理樣點長度10ms,采樣率8khz;對上述14個判據作出判斷的過程即為單幀檢測,單幀檢測結果作為長時窗檢測的輸入;
長時窗檢測采用300ms進行,包括:若由前述14個判據作出的判斷結果在300ms長時窗內均為IVD=1,則判斷當前語音通道為活動通道;若由前述14個判據作出的判斷結果在300ms長時窗內均為IVD=0,則判斷當前語音通道為非活動通道;若由前述14個判據作出的判斷結果在300ms長時窗中,IVD=1和IVD=0同時存在,則判斷該語音通道保持為前一狀態;語音通道狀態為活動通道時,該通道才參與橋路運算,否則該通道不參與橋路運算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶金美通信有限責任公司,未經重慶金美通信有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910103824.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:燃料噴射閥和用于制造燃料噴射閥閥座的方法
- 下一篇:廢氣流量調整器





