[發(fā)明專利]音頻處理方法及裝置在審
| 申請?zhí)枺?/td> | 202110468285.1 | 申請日: | 2021-04-28 |
| 公開(公告)號: | CN113192477A | 公開(公告)日: | 2021-07-30 |
| 發(fā)明(設(shè)計)人: | 范欣悅;崔凡;邢文浩;張晨;鄭羲光 | 申請(專利權(quán))人: | 北京達佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號: | G10H1/36 | 分類號: | G10H1/36;G10H1/42 |
| 代理公司: | 北京銘碩知識產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 王皎彤;朱志玲 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 處理 方法 裝置 | ||
本公開關(guān)于一種音頻處理方法及裝置。該音頻處理方法包括:獲取人聲信號的人聲音高序列和相應(yīng)的參考音高序列;計算人聲音高序列和參考音高序列之間的音高距離;基于音高距離對伴奏的音調(diào)進行調(diào)整。根據(jù)本公開的音頻處理方法及裝置,可基于人聲信號得到伴奏升降調(diào)的數(shù)值來自動幫助用戶找到適合用戶的音調(diào),而無需人工進行手動調(diào)整,從而提高用戶找調(diào)的體驗,并且提高用戶k歌的開口率和發(fā)布率。
技術(shù)領(lǐng)域
本公開涉及音視頻技術(shù)領(lǐng)域。更具體地,本公開涉及一種音頻處理方法及裝置。
背景技術(shù)
清唱找調(diào)是在無伴奏的條件下對人聲進行錄制,通過對原始伴奏進行升降調(diào)得到與采集到的人聲最匹配的伴奏結(jié)果。通過清唱找調(diào),演唱者無需手動對伴奏進行升降調(diào),系統(tǒng)便可智能化得對伴奏進行自動升降調(diào)得到跟清唱結(jié)果最為接近的調(diào)。
一些非專業(yè)歌手用戶在K歌時經(jīng)常被音域所困擾,喜歡的歌曲唱不上去,或者唱異性歌曲音域不匹配。通常會使用“升降調(diào)”功能修改伴奏的音調(diào)以適合自己。而對于很多用戶而言,調(diào)節(jié)音調(diào)是升還是降、升降多少,并沒有直觀的判斷,只能依靠不停地重試才能確定,甚至反復(fù)重試而不得其法。
發(fā)明內(nèi)容
本公開的示例性實施例在于提供一種音頻處理方法及裝置,以至少解決相關(guān)技術(shù)中的音頻處理的問題,也可不解決任何上述問題。
根據(jù)本公開的示例性實施例,提供一種音頻處理方法,包括:獲取人聲信號的人聲音高序列和相應(yīng)的參考音高序列;計算人聲音高序列和參考音高序列之間的音高距離;基于音高距離對伴奏的音調(diào)進行調(diào)整。
可選地,獲取人聲信號的人聲音高序列和相應(yīng)的參考音高序列的步驟可包括:獲取人聲信號和相應(yīng)的參考音高文件信息;對人聲信號進行基頻檢測,得到人聲音高序列;從參考音高文件信息獲取參考音高序列。
可選地,計算人聲音高序列和參考音高序列之間的音高距離的步驟可包括:對人聲音高序列和參考音高序列進行時長匹配,得到匹配結(jié)果;根據(jù)匹配結(jié)果對人聲音高序列進行時長縮放;計算縮放后的人聲音高序列和參考音高序列之間的差作為音高距離。
可選地,對人聲音高序列和參考音高序列進行時長匹配的步驟可包括:分別對人聲音高序列和參考音高序列進行歸一化處理;使用預(yù)定規(guī)則對歸一化處理后的人聲音高序列和歸一化處理后的參考音高序列進行時長匹配。
可選地,根據(jù)匹配結(jié)果對人聲音高序列進行時長縮放的步驟可包括:基于匹配結(jié)果將人聲音高序列調(diào)整至與參考音高序列時長相等。
可選地,計算縮放后的人聲音高序列和參考音高序列之間的音高距離的步驟可包括:將參考音高序列與縮放后的人聲音高序列相減,得到音高差值序列;計算音高差值序列中的所有音高差值的平均值,并將所有音高差值的平均值作為音高距離。
可選地,基于音高距離對伴奏的音調(diào)進行調(diào)整的步驟可包括:計算音調(diào)調(diào)整的判定參數(shù);當(dāng)判定參數(shù)滿足預(yù)設(shè)判定條件時,對伴奏的音調(diào)進行調(diào)整。
可選地,基于音高距離對伴奏的音調(diào)進行調(diào)整的步驟可包括:計算音高距離的方差;當(dāng)方差小于方差閾值時,基于音高距離對伴奏的音調(diào)進行調(diào)整。
可選地,基于音高距離對伴奏的音調(diào)進行調(diào)整的步驟可包括:從縮放后的人聲音高序列中重采樣和人聲音高序列的長度相同的序列,得到重采樣序列;計算重采樣序列和人聲音高序列之間的差值的平均值;當(dāng)差值的平均值小于平均值閾值時,基于音高距離對伴奏的音調(diào)進行調(diào)整。
可選地,基于音高距離對伴奏的音調(diào)進行調(diào)整的步驟可包括:確定人聲音高序列和參考音高序列的相似程度;當(dāng)相似程度小于相似程度閾值時,基于音高距離對伴奏的音調(diào)進行調(diào)整。
可選地,所述音頻處理方法還可包括:當(dāng)判定參數(shù)不滿足預(yù)設(shè)判定條件時,輸出找調(diào)失敗的信息。
可選地,人聲信號可以是人聲清唱信號。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110468285.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





