[發(fā)明專利]一種音頻數(shù)據(jù)的對齊方法、裝置、設備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010920844.3 | 申請日: | 2020-09-04 |
| 公開(公告)號: | CN112017622B | 公開(公告)日: | 2023-02-21 |
| 發(fā)明(設計)人: | 熊佳;周年斌 | 申請(專利權)人: | 廣州趣丸網(wǎng)絡科技有限公司 |
| 主分類號: | G10H1/36 | 分類號: | G10H1/36 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司 11227 | 代理人: | 楊小紅 |
| 地址: | 510000 廣東省廣州市天河區(qū)黃埔大道西122號之二1701房*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 數(shù)據(jù) 對齊 方法 裝置 設備 存儲 介質(zhì) | ||
1.一種音頻數(shù)據(jù)的對齊方法,其特征在于,包括步驟:
S1、獲取待對齊的原始錄音數(shù)據(jù)和原始伴奏數(shù)據(jù);其中,所述原始錄音數(shù)據(jù)包括人聲和錄音伴奏;
S11、將所述原始錄音數(shù)據(jù)中歌詞起點前預置長度的音頻數(shù)據(jù)截取,得到第一截取音頻數(shù)據(jù);將所述原始伴奏數(shù)據(jù)中歌詞起點前所述預置長度的音頻數(shù)據(jù)截取,得到第二截取音頻數(shù)據(jù);
S12、將所述第一截取音頻數(shù)據(jù)和所述第二截取音頻數(shù)據(jù)降頻至第一預置頻率;
S2、通過相似性檢測公式,對降頻后的第一截取音頻數(shù)據(jù)和降頻后的第二截取音頻數(shù)據(jù)進行相似性檢測,得到降頻后的原始錄音數(shù)據(jù)的延時采樣點數(shù),其中,所述相似性檢測公式為:
式中,Xcorrmax對應的位置即延時采樣點數(shù),Xcorr(i)為第i個波形點位置對應的相似度值,n為用于做相似性檢測的波形點的音頻波形點數(shù)量,xj為用于做相似性檢測的原始錄音數(shù)據(jù)的第j個波形點,yj-i為用于做相似性檢測的原始伴奏數(shù)據(jù)的第j-i個波形點,x為原始錄音數(shù)據(jù),y為原始伴奏數(shù)據(jù),i和j分別為波形點位置;
S3、將所述原始伴奏數(shù)據(jù)的頻率和所述原始錄音數(shù)據(jù)的頻率調(diào)整一致;
S4、從所述原始錄音數(shù)據(jù)中刪除所述延時采樣點數(shù),以實現(xiàn)所述原始錄音數(shù)據(jù)和所述原始伴奏數(shù)據(jù)的對齊。
2.根據(jù)權利要求1所述的音頻數(shù)據(jù)的對齊方法,其特征在于,步驟S3具體包括:
將所述原始伴奏數(shù)據(jù)的頻率調(diào)整至所述原始錄音數(shù)據(jù)的頻率。
3.根據(jù)權利要求2所述的音頻數(shù)據(jù)的對齊方法,其特征在于,步驟S2之后還包括:
將所述延時采樣點數(shù)升頻至所述原始伴奏數(shù)據(jù)的頻率,得到新延時采樣點數(shù),并通過所述新延時采樣點數(shù)執(zhí)行后續(xù)步驟。
4.根據(jù)權利要求1所述的音頻數(shù)據(jù)的對齊方法,其特征在于,步驟S4之前還包括:
將所述延時采樣點數(shù)和預置閾值做差,得到第一中間數(shù)據(jù);
則步驟S4具體包括:
從所述原始錄音數(shù)據(jù)中刪除所述第一中間數(shù)據(jù),以實現(xiàn)所述原始錄音數(shù)據(jù)和所述原始伴奏數(shù)據(jù)的對齊。
5.根據(jù)權利要求1所述的音頻數(shù)據(jù)的對齊方法,其特征在于,步驟S4之后還包括:
S5、將刪除所述延時采樣點數(shù)后的所述原始錄音數(shù)據(jù)和所述原始伴奏數(shù)據(jù)進行混音處理。
6.一種音頻數(shù)據(jù)的對齊裝置,其特征在于,包括:
獲取單元,用于獲取待對齊的原始錄音數(shù)據(jù)和原始伴奏數(shù)據(jù);其中,所述原始錄音數(shù)據(jù)包括人聲和播放伴奏;還用于將所述原始錄音數(shù)據(jù)中歌詞起點前預置長度的音頻數(shù)據(jù)截取,得到第一截取音頻數(shù)據(jù);還用于將所述原始伴奏數(shù)據(jù)中歌詞起點前所述預置長度的音頻數(shù)據(jù)截取,得到第二截取音頻數(shù)據(jù);
將所述第一截取音頻數(shù)據(jù)和所述第二截取音頻數(shù)據(jù)降頻至第一預置頻率;
檢測單元,用于通過相似性檢測公式,對降頻后的第一截取音頻數(shù)據(jù)和降頻后的第二截取音頻數(shù)據(jù)進行相似性檢測,得到降頻后的原始錄音數(shù)據(jù)的延時采樣點數(shù),其中,所述相似性檢測公式為:
式中,Xcorrmax對應的位置即延時采樣點數(shù),Xcorr(i)為第i個波形點位置對應的相似度值,n為用于做相似性檢測的波形點的音頻波形點數(shù)量,xj為用于做相似性檢測的原始錄音數(shù)據(jù)的第j個波形點,yj-i為用于做相似性檢測的原始伴奏數(shù)據(jù)的第j-i個波形點,x為原始錄音數(shù)據(jù),y為原始伴奏數(shù)據(jù),i和j分別為波形點位置;
調(diào)整單元,用于將所述原始伴奏數(shù)據(jù)的頻率和所述原始錄音數(shù)據(jù)的頻率調(diào)整一致;
刪除單元,用于從所述原始錄音數(shù)據(jù)中刪除所述延時采樣點數(shù),以實現(xiàn)所述原始錄音數(shù)據(jù)和所述原始伴奏數(shù)據(jù)的對齊。
7.根據(jù)權利要求6所述的音頻數(shù)據(jù)的對齊裝置,其特征在于,所述調(diào)整單元具體用于,將所述原始伴奏數(shù)據(jù)的頻率調(diào)整至所述原始錄音數(shù)據(jù)的頻率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州趣丸網(wǎng)絡科技有限公司,未經(jīng)廣州趣丸網(wǎng)絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010920844.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





