[發明專利]音量調節方法、裝置、電子設備以及存儲介質有效

申請號：	202010537487.2	申請日：	2020-06-12
公開（公告）號：	CN111653263B	公開（公告）日：	2023-03-31
發明（設計）人：	張倩	申請（專利權）人：	百度在線網絡技術（北京）有限公司
主分類號：	G10L13/033	分類號：	G10L13/033;G10L13/02;G06F3/16
代理公司：	北京銀龍知識產權代理有限公司 11243	代理人：	許靜;黃燦
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音量調節方法裝置電子設備以及存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種音量調節方法，包括：

將包括原聲音頻和疊加音頻的音頻數據進行分解，獲得所述原聲音頻和所述疊加音頻；

對所述原聲音頻和/或所述疊加音頻的音量進行調節；

執行音頻合成操作，以得到目標音頻；

其中，在對所述原聲音頻和所述疊加音頻進行音量調節的情況下，所述音頻合成操作為將音量調節后的所述原聲音頻和所述疊加音頻進行合并，或者，在對所述原聲音頻或者所述疊加音頻進行音量調節的情況下，所述音頻合成操作為將音量調節后的音頻與未進行音量調節的音頻進行合并。

2.根據權利要求1所述的方法，其中，所述將包括原聲音頻和疊加音頻的音頻數據進行分解，獲得所述原聲音頻和所述疊加音頻，包括：

將包括所述原聲音頻和所述疊加音頻的音頻數據通過分解模型進行分解，獲得所述原聲音頻和所述疊加音頻；

所述分解模型基于標記的樣本音頻數據訓練獲得。

3.根據權利要求2所述的方法，其中，所述樣本音頻數據的標記過程包括：

對所述樣本音頻數據中的混合音頻段和原聲音頻段進行標記；

所述混合音頻段為包括樣本原聲音頻和樣本疊加音頻的時間段；所述原聲音頻段為不包括樣本疊加音頻的時間段。

4.根據權利要求1所述的方法，其中，在所述對所述原聲音頻和/或所述疊加音頻的音量進行調節之前，還包括：

顯示音量調節界面；

接收針對所述音量調節界面的輸入操作，獲得第一音量值和/或第二音量值；

所述對所述原聲音頻和/或所述疊加音頻的音量進行調節，包括：

根據所述第一音量值，調整所述原聲音頻的音量；

和/或；

根據所述第二音量值，調整所述疊加音頻的音量。

5.根據權利要求1所述的方法，其中，在所述將包括原聲音頻和疊加音頻的音頻數據進行分解，獲得所述原聲音頻和所述疊加音頻之前，還包括：

從視頻文件中提取所述音頻數據。

6.一種音量調節裝置，包括：

分解模塊，用于將包括原聲音頻和疊加音頻的音頻數據進行分解，獲得所述原聲音頻和所述疊加音頻；

調節模塊，用于對所述原聲音頻和/或所述疊加音頻的音量進行調節；

合成模塊，用于執行音頻合成操作，以得到目標音頻，其中，在對所述原聲音頻和所述疊加音頻進行音量調節的情況下，所述音頻合成操作為將音量調節后的所述原聲音頻和所述疊加音頻進行合并，或者，在對所述原聲音頻或者所述疊加音頻進行音量調節的情況下，所述音頻合成操作為將音量調節后的音頻與未進行音量調節的音頻進行合并。

7.根據權利要求6所述的裝置，其中，所述分解模塊，用于：

將包括所述原聲音頻和所述疊加音頻的音頻數據通過分解模型進行分解，獲得所述原聲音頻和所述疊加音頻；

所述分解模型基于標記的樣本音頻數據訓練獲得。

8.根據權利要求7所述的裝置，其中，所述樣本音頻數據的標記過程包括：

對所述樣本音頻數據中的混合音頻段和原聲音頻段進行標記；

所述混合音頻段為包括樣本原聲音頻和樣本疊加音頻的時間段；所述原聲音頻段為不包括樣本疊加音頻的時間段。

9.根據權利要求6所述的裝置，其中，還包括：

顯示模塊，用于顯示音量調節界面；

接收輸入模塊，用于接收針對所述音量調節界面的輸入操作，獲得第一音量值和/或第二音量值；

所述調節模塊，用于：

根據所述第一音量值，調整所述原聲音頻的音量；

和/或；