[發明專利]一種視訊系統的實時音頻擇路方法在審
| 申請號: | 202310533844.1 | 申請日: | 2023-05-12 |
| 公開(公告)號: | CN116471263A | 公開(公告)日: | 2023-07-21 |
| 發明(設計)人: | 陳賢斌;張路 | 申請(專利權)人: | 杭州全能數字科技有限公司 |
| 主分類號: | H04L65/80 | 分類號: | H04L65/80;H04L65/752;H04L65/75;H04L65/403;H04L65/65;H04N7/15;G10L19/26;G10L21/007;G10L25/60;G06F3/16 |
| 代理公司: | 安徽新越誠途專利代理事務所(普通合伙) 34261 | 代理人: | 吳偉晨 |
| 地址: | 310000 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視訊 系統 實時 音頻 方法 | ||
1.一種視訊系統的實時音頻擇路方法,其特征在于,所述方法包括:
步驟一、設置音頻擇路最大激活路數K;
步驟二、媒體服務從網絡接收數據,并解析為RTP音頻數據;
步驟三、將獲得的RTP音頻數據進行處理后插入到滑動窗口;
步驟四、判斷當前激活的音頻路數是否超過設置的最大激活路數K,若為否,則將RTP音頻數據直接投遞到音頻管道,否則進行步驟五;
步驟五、對每路語音的滑動窗口求和,使用TOP-K算法選出K路,判斷當前輸入源是否屬于K,若為是,則將音頻數據輸入音頻管道,否則丟棄;
步驟六、將輸入音頻管道的音頻數據進行音量處理后傳輸到廣播播報系統進行播報。
2.根據權利要求1所述的一種視訊系統的實時音頻擇路方法,其特征在于,所述步驟二中解析的RTP音頻數據是按照SDP協商約定解析成攜帶Audiolevel擴展的RTP音頻數據。
3.根據權利要求1所述的一種視訊系統的實時音頻擇路方法,其特征在于,所述步驟三中的處理方法為:
先將RTP數據透傳到音頻通道預創建好的音頻過濾器內,并讀取RTP數據中的Audiolevel字段;
然后用127減去Audiolevel字段得到音頻的能量值;
將獲取的能量值通過濾波器進行濾波平滑處理。
4.根據權利要求3所述的一種視訊系統的實時音頻擇路方法,其特征在于,所述濾波器處理的方法包括靜態濾波處理以及動態濾波處理,所述動態濾波處理系數根據發言者所處環境變化而變化,所述靜態濾波處理系數根據設備歷史數據獲取。
5.根據權利要求1所述的一種視訊系統的實時音頻擇路方法,其特征在于,所述步驟六中音量處理的方法為:
獲取每段音頻數據的音頻波形圖,根據音頻波形圖來獲取音頻數據的響度值以及音調值,根據響度值以及音調值的變化來求得該段音頻數據的質量波動值,從而根據質量波動值的大小來相應的調整整段音頻數據的音量。
6.根據權利要求1所述的一種視訊系統的實時音頻擇路方法,其特征在于,所述音頻管道內還設有提醒單元,所述提醒單元用于每隔T時間段采集系統內的平均音量,并與系統預設音量進行比較:
若平均音量大于預設音量,則進行降音提醒;
若平均音量小于預設音量,則進行升音提醒;
若平均音量與預設音量一致,則不提醒。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州全能數字科技有限公司,未經杭州全能數字科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310533844.1/1.html,轉載請聲明來源鉆瓜專利網。





