[發明專利]一種提升視頻會議系統混音容量的方法有效
| 申請號: | 201610191335.5 | 申請日: | 2016-03-30 |
| 公開(公告)號: | CN105743911B | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 邊學工;唐雪華;王中元;鄧亮;汪亞洲 | 申請(專利權)人: | 武漢隨銳億山科技有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04N7/15;H04N5/222 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430070 湖北省武漢市東湖高新技術開發區*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提升 視頻會議系統 音容 方法 | ||
1.一種提升視頻會議系統混音容量的方法,其特征在于,包括以下步驟:
步驟1:活動語音標記提取;
從接收的opus編碼語音幀中提取語音活動標記VAD,VAD標記分0、1、2三種值,分別指示非活動語音、活動語音、無法判斷三種情況;
步驟2:非活動語音丟棄;
對判斷為非活動語音的opus幀在網絡接收層選擇性丟棄,同時修改后續的RTP包參數;
步驟2的具體實現包括以下子步驟:
步驟2.1:設置非活動語音幀丟棄門限T,如果兩次活動語音幀間連續的非活動語音幀數目超過了門限T,則將其間的非活動語音幀全部丟棄;否則保留;
步驟2.2:修改后續語音幀RTP包的序列號和時間戳,確保序列號連續、時間戳遞增;
步驟3:靜音插入;
當混音器輸入語音緩沖區出現下溢時,填充靜音幀,同時給出靜音幀的VAD標記和能量參數的值。
2.根據權利要求1所述的提升視頻會議系統混音容量的方法,其特征在于,步驟1的具體實現包括以下子步驟:
步驟1.1:解析opus碼流中編碼模式指示位,將當前語音幀區分為silk、celt和混合編碼三種模式;所述碼流為接收的opus編碼語音幀;
步驟1.2:對silk和混合模式,解析碼流中VAD標記指示位,獲得VAD的0或1標記,0表明為非活動語音,1表明為活動語音;對celt模式,由于碼流沒有提供VAD指示信息,視為無法判斷處理,將VAD標記置為2。
3.根據權利要求1所述的提升視頻會議系統混音容量的方法,其特征在于,步驟3的具體實現包括以下子步驟:
步驟3.1:對沒有丟棄的活動語音和部分非活動語音,執行opus解碼,同時將解碼后語音的采樣率轉換到混音器工作的采樣率上,采樣率統一后的數據寫入混音器輸入緩沖區;
步驟3.2:混音器從輸入緩沖區讀取數據成功時,計算一幀語音的能量參數,若步驟1中提取的VAD標記為0或1,直接保留;否則,若為2,則進一步重新計算該語音幀的VAD標記;
步驟3.3:混音器從輸入緩沖區讀取數據出現下溢時,將待讀取長度的語音數據用全零取代,同時賦予VAD和能量參數為0,跳過采樣率轉換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢隨銳億山科技有限公司,未經武漢隨銳億山科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610191335.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:負極活性材料和電池
- 下一篇:用于對洗衣機進行控制的方法





