[發明專利]音頻校準方法、裝置及存儲介質在審
| 申請號: | 202010590868.7 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111785238A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 李勝存 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10H1/02 | 分類號: | G10H1/02;G10H1/36;G10L25/51 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 彭緒坤 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 校準 方法 裝置 存儲 介質 | ||
本發明實施例公開了一種音頻校準方法、裝置及存儲介質。該方案可以獲取翻唱音頻以及標準音頻,并分別計算翻唱音頻當中每個字的音高與標準音頻中每個字的音高,及其每個對應字的音高之間的偏差值,根據偏差值對翻唱音頻進行校準,以得到翻唱音頻中每個字的修復音頻,根據偏差值確定翻唱音頻中每個字的刻度影射值,實時獲取刻度設置值,并將刻度設置值與翻唱音頻中每個字的刻度影射值進行對比,根據對比結果從每個字的修復音頻以及翻唱音頻當中選取目標音頻進行輸出。本申請實施例通過翻唱音頻當中每個字的音高與標準音頻中對應字的音高之間的偏差值來設置刻度影射值,從而結合刻度設置值實時調節音頻的校準程度,提升音頻校準的效率。
技術領域
本發明涉及數據處理技術領域,具體涉及一種音頻校準方法、裝置及存儲介質。
背景技術
近些年來,移動端K歌軟件的市場規模逐漸擴大,用戶群體遍布各個年齡段以及各種音樂層次。特別是隨著智能手機、平板電腦等智能終端的普及,使得用戶足不出戶進行K歌成為了一種可能。比如,用戶在智能手機上安裝了K歌軟件后,無需走進KTV便可實現歌曲演唱。其中此類軟件的主要場景之一就是錄歌,也就是伴奏與人聲兩路音頻信號,通過信號處理技術最終產生合成作品的一路音頻信號數據即為用戶的翻唱作品。
目前使用市面上的K歌APP錄音時,用戶交互中重要的一個環節是在用戶對翻唱作品調節時讓用戶選擇他偏好的修音程度,一些他認為無需要修復的段落保留原樣,一些他認為唱的音準偏大的段落才應用修音算法。解決這一問題傳統的方法將應用從簡單修音到精修細分為一個或多個級別,讓用戶選擇。
在實現本發明過程中,發明人發現,這種傳統的修音方法在用戶更改修音級別后需要重新計算,才能進行針對性的校準,因此需要進行多次調節才能找到最合適的修音級別,反復調節將會大大降低音頻校準的效率。
發明內容
本發明實施例提供一種音頻校準方法、裝置及存儲介質,可以有效提升音頻的校準效率。
本發明實施例提供一種音頻校準方法,包括:
獲取翻唱音頻以及標準音頻,并分別計算所述翻唱音頻當中每個字的音高與所述標準音頻中每個字的音高,及其每個對應字的音高之間的偏差值;
根據所述偏差值對所述翻唱音頻進行校準,以得到所述翻唱音頻中每個字的修復音頻;
根據所述偏差值確定所述翻唱音頻中每個字的刻度影射值;
實時獲取刻度設置值,并將所述刻度設置值與所述翻唱音頻中每個字的刻度影射值進行對比;
若所述刻度影射值大于刻度設置值,則選取對應的字的翻唱音頻作為目標音頻進行輸出;
若所述刻度影射值不大于刻度設置值,則選取對應的字的修復音頻作為目標音頻進行輸出。
本發明實施例還提供一種音頻校準裝置,包括:
獲取單元,用于獲取翻唱音頻以及標準音頻,并分別計算所述翻唱音頻當中每個字的音高與所述標準音頻中每個字的音高,及其每個對應字的音高之間的偏差值;
校準單元,用于根據所述偏差值對所述翻唱音頻進行校準,以得到所述翻唱音頻中每個字的修復音頻;
計算單元,用于根據所述偏差值確定所述翻唱音頻中每個字的刻度影射值;
對比單元,用于實時獲取刻度設置值,并將所述刻度設置值與所述翻唱音頻中每個字的刻度影射值進行對比;
輸出單元,用于當所述刻度影射值大于刻度設置值時,選取對應的字的翻唱音頻作為目標音頻進行輸出,當所述刻度影射值不大于刻度設置值時,選取對應的字的修復音頻作為目標音頻進行輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010590868.7/2.html,轉載請聲明來源鉆瓜專利網。





