[發(fā)明專利]一種直播間的音量調節(jié)方法及客戶端有效

申請?zhí)枺?/td>	201811031021.4	申請日：	2018-09-05
公開（公告）號：	CN108965904B	公開（公告）日：	2021-08-06
發(fā)明（設計）人：	潘璠	申請（專利權）人：	阿里巴巴（中國）有限公司
主分類號：	H04N21/2187	分類號：	H04N21/2187;H04N21/439;H04N21/4402;H04N21/6437
代理公司：	北京三友知識產權代理有限公司 11127	代理人：	李輝;陳剛
地址：	310052 浙江省杭州市濱江***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種直播音量調節(jié) 方法客戶端
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施方式公開了一種直播間的音量調節(jié)方法及客戶端，其中，所述方法包括：從語音服務器處下載與當前用戶處于同一直播組的其他用戶的語音流，并從直播服務器處下載直播音視頻流；將下載的所述語音流合成為一股語音流，并對合成后的語音流進行解碼，得到人聲音軌，并對下載的所述直播音視頻流進行解碼，得到直播音軌；識別所述人聲音軌的音量，并根據(jù)識別出的所述音量，調節(jié)所述直播音軌的音量大?。粚⑺鋈寺曇糗壓驼{節(jié)音量之后的直播音軌合并為一個音軌，并輸出合并之后的音軌。本申請?zhí)峁┑募夹g方案，能夠提高用戶的視聽體驗。

技術領域

本申請涉及互聯(lián)網技術領域，特別涉及一種直播間的音量調節(jié)方法及客戶端。

背景技術

隨著視頻直播的興起，涌現(xiàn)出大量的視頻直播平臺。在視頻直播平臺中，可以劃分多個視頻直播間，這些視頻直播間通常由主播主持。主播可以將直播內容推送至直播服務器，然后視頻直播間內的用戶可以從直播服務器處下載并觀看該視頻直播間的直播內容。

當前，用戶觀看的直播內容中，可能會有主持人在講解該直播內容。例如，在某個足球轉播的直播間內，主持人與用戶通常在觀看足球賽，同時，主持人還需要對球賽進行解說。在這種情況下，用戶的客戶端會接收到球賽的直播內容，同時還會接收到主持人解說的語音內容。通常而言，用戶只能統(tǒng)一調整直播間內的音量，而不能單獨調整直播內容或者解說的語音內容各自的音量。這就導致有時候直播內容音量過大，會覆蓋解說的語音內容。此外，通過用戶手動調整音量的方式，會加重用戶的負擔。因此，目前的直播間的音量調節(jié)方式，具備較差的視聽體驗。

發(fā)明內容

本申請實施方式的目的是提供一種直播間的音量調節(jié)方法及客戶端，能夠提高用戶的視聽體驗。

為實現(xiàn)上述目的，本申請實施方式提供一種直播間的音量調節(jié)方法，所述方法包括：從語音服務器處下載與當前用戶處于同一直播組的其他用戶的語音流，并從直播服務器處下載直播音視頻流；將下載的所述語音流合成為一股語音流，并對合成后的語音流進行解碼，得到人聲音軌，并對下載的所述直播音視頻流進行解碼，得到直播音軌；識別所述人聲音軌的音量，并根據(jù)識別出的所述音量，調節(jié)所述直播音軌的音量大??；將所述人聲音軌和調節(jié)音量之后的直播音軌合并為一個音軌，并輸出合并之后的音軌。

為實現(xiàn)上述目的，本申請實施方式還提供一種客戶端，所述客戶端包括：數(shù)據(jù)下載單元，用于從語音服務器處下載與當前用戶處于同一直播組的其他用戶的語音流，并從直播服務器處下載直播音視頻流；解碼單元，用于將下載的所述語音流合成為一股語音流，并對合成后的語音流進行解碼，得到人聲音軌，并對下載的所述直播音視頻流進行解碼，得到直播音軌；音量調節(jié)單元，用于識別所述人聲音軌的音量，并根據(jù)識別出的所述音量，調節(jié)所述直播音軌的音量大小；音軌輸出單元，用于將所述人聲音軌和調節(jié)音量之后的直播音軌合并為一個音軌，并輸出合并之后的音軌。

為實現(xiàn)上述目的，本申請實施方式還提供一種客戶端，所述客戶端包括存儲器和處理器，所述存儲器用于存儲計算機程序，所述計算機程序被所述處理器執(zhí)行時，實現(xiàn)上述的直播間的音量調節(jié)方法。

由上可見，本申請?zhí)峁┑募夹g方案，客戶端可以從語音服務器處下載同一直播組其他用戶的語音流，并可以從直播服務器處下載直播音視頻流。然后，將這兩種不同的數(shù)據(jù)流分別解碼，從而得到人聲音軌和直播音軌。然后，可以識別所述人聲音軌的音量，并根據(jù)識別出的所述音量，調節(jié)所述直播音軌的音量大小。具體地，當出現(xiàn)人聲音軌時，可以適當調低直播音軌的音量；而當不存在人聲音軌時，可以適當調高直播音軌的音量。最終，可以將所述人聲音軌和調節(jié)音量之后的直播音軌合并為一個音軌，并輸出合并之后的音軌。由上可見，客戶端可以針對人聲音軌當前的音量情況，對直播音軌進行動態(tài)調整，使得用戶能夠聽清人聲音軌的內容，從而能夠提高用戶的視聽體驗。

附圖說明

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴（中國）有限公司，未經阿里巴巴（中國）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811031021.4/2.html，轉載請聲明來源鉆瓜專利網。