[發明專利]一種混音方法和裝置有效
| 申請號: | 202011375166.3 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112489664B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 熊佳;陳森海;徐志堅;謝睿;陳光堯 | 申請(專利權)人: | 廣州趣丸網絡科技有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 蘇云輝 |
| 地址: | 510000 廣東省廣州市天河區黃埔大道西122號之二1701房*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 方法 裝置 | ||
本申請公開了一種混音方法和裝置,其中方法包括:獲取用于混音的人聲錄音和背景音樂;對人聲錄音進行語音活動性檢測,獲取人聲錄音的第一能量;對背景音樂進行能量檢測,獲取背景音樂的第二能量;根據預置人聲錄音系數計算公式,結合第一能量和第二能量,計算人聲錄音對應的人聲錄音系數;根據預置背景音樂系數計算公式,結合第一能量和第二能量,計算背景音樂對應的背景音樂系數;基于人聲錄音系數、背景音樂系數對人聲錄音和背景音樂進行混音,得到混音文件。解決了現有的混音調節方法,人為操作麻煩降低了用戶體驗的技術問題。
技術領域
本申請涉及混音技術領域,尤其涉及一種混音方法和裝置。
背景技術
聲音作為傳遞信息的載體,在人們的日常溝通中起重要作用。互聯網時代,用于豐富人們生活的聲音類產品越來越多。在很多聲音類產品中,都會有人聲錄音疊加背景音樂的混音播放場景。但如果處理不當,人聲錄音和背景音樂的混音效果不佳,會引起人耳聽感的不適。因此,改善人聲錄音和背景音樂的混音效果,對于提升用戶的聲音體驗非常重要。
很多聲音類APP的常規做法是,提供一個音量調節界面,用戶在錄制人聲時手動調節人聲錄音和背景音樂的音量,然后混音獲得一個人聲錄音和背景音樂聽感舒適的混音效果。然而上述的混音調節方法,人為操作麻煩降低了用戶體驗。
發明內容
本申請提供了一種混音方法和裝置,解決了現有的混音調節方法,人為操作麻煩降低了用戶體驗的技術問題。
有鑒于此,本申請第一方面提供了一種混音方法,包括:
獲取用于混音的人聲錄音和背景音樂;
對所述人聲錄音進行語音活動性檢測,獲取所述人聲錄音的第一能量;對所述背景音樂進行能量檢測,獲取所述背景音樂的第二能量;
根據預置人聲錄音系數計算公式,結合所述第一能量和所述第二能量,計算所述人聲錄音對應的人聲錄音系數;
根據預置背景音樂系數計算公式,結合所述第一能量和所述第二能量,計算所述背景音樂對應的背景音樂系數;
基于所述人聲錄音系數、所述背景音樂系數對所述人聲錄音和所述背景音樂進行混音,得到混音文件。
可選地,對所述人聲錄音進行語音活動性檢測,獲取所述人聲錄音的第一能量,具體包括:
對所述人聲錄音逐幀進行語音活動性檢測,獲取所述人聲錄音各幀的第一子能量;
根據所有所述第一子能量,計算所述人聲錄音的第一能量。
可選地,對所述背景音樂進行能量檢測,獲取所述背景音樂的第二能量,具體包括:
對所述背景音樂逐幀進行能量檢測,獲取所述背景音樂各幀的第二子能量;
根據所有所述第二子能量,計算所述背景音樂的第二能量。
可選地,預置人聲錄音系數計算公式為:
其中,coefv為人聲錄音系數,為第二能量,為第一能量。
可選地,預置背景音樂系數計算公式為:
其中,coefm為背景音樂系數,為第二能量,為第一能量。
可選地,基于所述人聲錄音系數、所述背景音樂系數對所述人聲錄音和所述背景音樂進行混音,得到混音文件,具體包括:
將所述人聲錄音系數和所述人聲錄音相乘,得到第一中間文件;
將所述背景音樂系數和所述背景音樂相乘,得到第二中間文件;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州趣丸網絡科技有限公司,未經廣州趣丸網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011375166.3/2.html,轉載請聲明來源鉆瓜專利網。





