[發(fā)明專(zhuān)利]音頻數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201911058911.9 | 申請(qǐng)日: | 2019-10-31 |
| 公開(kāi)(公告)號(hào): | CN110890083B | 公開(kāi)(公告)日: | 2022-09-02 |
| 發(fā)明(設(shè)計(jì))人: | 張晨;董培 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京達(dá)佳互聯(lián)信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G10H1/40 | 分類(lèi)號(hào): | G10H1/40 |
| 代理公司: | 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100085 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 數(shù)據(jù) 處理 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本公開(kāi)關(guān)于一種音頻數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),其中,所述方法包括:計(jì)算每一幀音頻信號(hào)的能量值和短時(shí)平均能量值;根據(jù)當(dāng)前幀音頻信號(hào)的能量值、短時(shí)平均能量值和門(mén)限值檢測(cè)得到多個(gè)第一節(jié)拍點(diǎn);根據(jù)節(jié)拍點(diǎn)提取函數(shù)在多個(gè)第一節(jié)拍點(diǎn)中搜索出多個(gè)第二節(jié)拍點(diǎn),第二節(jié)拍點(diǎn)表示音頻數(shù)據(jù)的強(qiáng)弱規(guī)律的程度大于或等于第一節(jié)拍點(diǎn)表示音頻數(shù)據(jù)的強(qiáng)弱規(guī)律的程度。本公開(kāi)通過(guò)音頻信號(hào)的能量值和短時(shí)平均能量值初步檢測(cè)得到多個(gè)第一節(jié)拍點(diǎn),再利用節(jié)拍點(diǎn)提取函數(shù)從多個(gè)第一節(jié)拍點(diǎn)中搜索出多個(gè)第二節(jié)拍點(diǎn),相比于直接將重音信號(hào)作為節(jié)拍點(diǎn)而言,第二節(jié)拍點(diǎn)更加能夠表示音頻數(shù)據(jù)的強(qiáng)弱規(guī)律的程度,本公開(kāi)檢測(cè)節(jié)拍點(diǎn)的準(zhǔn)確度更高。
技術(shù)領(lǐng)域
本公開(kāi)涉及音頻數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種音頻數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
節(jié)拍是衡量節(jié)奏的單位,比喻有規(guī)律的進(jìn)程。在音樂(lè)中,節(jié)拍指有一定強(qiáng)弱區(qū)別的一系列拍子在每隔一定時(shí)間重復(fù)出現(xiàn)。音樂(lè)的節(jié)拍點(diǎn)檢測(cè)除了用于對(duì)音樂(lè)進(jìn)行類(lèi)型分析之外,越來(lái)越多地應(yīng)用于服務(wù)或者內(nèi)容生產(chǎn)方面。例如,利用對(duì)視頻數(shù)據(jù)中的音樂(lè)檢測(cè)到的節(jié)拍點(diǎn)控制魔法表情,或者控制視頻、圖片的轉(zhuǎn)場(chǎng),以提升視頻數(shù)據(jù)的律動(dòng)性。
相關(guān)技術(shù)中,在檢測(cè)音樂(lè)的節(jié)拍點(diǎn)時(shí),過(guò)濾出音樂(lè)的低頻部分,將低頻部分能量較大的信號(hào)認(rèn)為是重音信號(hào),將重音信號(hào)標(biāo)記為節(jié)拍點(diǎn)。但是,重音信號(hào)表示音樂(lè)中強(qiáng)度較大的信號(hào),無(wú)法表示強(qiáng)度本身。重音信號(hào)是構(gòu)成節(jié)奏的主要因素,無(wú)法替代節(jié)拍點(diǎn)。因此,通過(guò)目前的節(jié)拍點(diǎn)檢測(cè)方案檢測(cè)到的節(jié)拍點(diǎn)不準(zhǔn)確。
發(fā)明內(nèi)容
本公開(kāi)提供了一種音頻數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以至少解決相關(guān)技術(shù)中節(jié)拍點(diǎn)檢測(cè)不準(zhǔn)確的問(wèn)題。本公開(kāi)的技術(shù)方案如下:
根據(jù)本公開(kāi)實(shí)施例的第一方面,提供了一種音頻數(shù)據(jù)的處理方法,包括:獲取待處理的音頻數(shù)據(jù);計(jì)算所述音頻數(shù)據(jù)的每一幀音頻信號(hào)的能量值和短時(shí)平均能量值,所述短時(shí)平均能量值表示一幀音頻信號(hào)對(duì)應(yīng)的時(shí)間段的平均能量值;針對(duì)每一幀音頻信號(hào),根據(jù)當(dāng)前幀音頻信號(hào)的所述能量值、所述短時(shí)平均能量值和預(yù)設(shè)的門(mén)限值檢測(cè)得到所述當(dāng)前幀音頻信號(hào)的多個(gè)第一節(jié)拍點(diǎn);根據(jù)預(yù)設(shè)的節(jié)拍點(diǎn)提取函數(shù)在多個(gè)所述第一節(jié)拍點(diǎn)中搜索出多個(gè)第二節(jié)拍點(diǎn),所述第二節(jié)拍點(diǎn)表示所述音頻數(shù)據(jù)的強(qiáng)弱規(guī)律的程度大于或等于所述第一節(jié)拍點(diǎn)表示所述音頻數(shù)據(jù)的強(qiáng)弱規(guī)律的程度。
可選地,所述針對(duì)每一幀音頻信號(hào),根據(jù)當(dāng)前幀音頻信號(hào)的所述能量值、所述短時(shí)平均能量值和預(yù)設(shè)的門(mén)限值檢測(cè)得到所述當(dāng)前幀音頻信號(hào)的多個(gè)第一節(jié)拍點(diǎn)的步驟,包括:針對(duì)每一幀音頻信號(hào),將當(dāng)前幀音頻信號(hào)的所述能量值與所述短時(shí)平均能量值的比值與所述門(mén)限值進(jìn)行比較;若所述比值大于所述門(mén)限值,則將所述當(dāng)前幀音頻信號(hào)作為所述第一節(jié)拍點(diǎn)。
可選地,所述根據(jù)預(yù)設(shè)的節(jié)拍點(diǎn)提取函數(shù)在多個(gè)所述第一節(jié)拍點(diǎn)中搜索出多個(gè)第二節(jié)拍點(diǎn)的步驟,包括:計(jì)算所述節(jié)拍點(diǎn)提取函數(shù)的最大值;所述節(jié)拍點(diǎn)提取函數(shù)表示cos(2*M_PI*(t-t0)/p),其中,所述M_PI表示圓周率,所述t表示所述第一節(jié)拍點(diǎn)在所述音頻數(shù)據(jù)中的幀序號(hào),所述t0表示偏移值,所述偏移值表示第一個(gè)所述第二節(jié)拍點(diǎn)在所述音頻數(shù)據(jù)中的幀序號(hào),所述p表示所述第一節(jié)拍點(diǎn)的數(shù)量,所述t0∈[1,p];將所述節(jié)拍點(diǎn)提取函數(shù)為所述最大值時(shí)的所述偏移值對(duì)應(yīng)的所述第一節(jié)拍點(diǎn)作為第一個(gè)所述第二節(jié)拍點(diǎn);根據(jù)所述節(jié)拍點(diǎn)提取函數(shù)為所述最大值時(shí)的所述數(shù)量計(jì)算相鄰兩個(gè)所述第二節(jié)拍點(diǎn)之間的時(shí)間間隔;從第一個(gè)所述第二節(jié)拍點(diǎn)開(kāi)始,按照所述時(shí)間間隔依次確定多個(gè)所述第二節(jié)拍點(diǎn)。
可選地,所述計(jì)算所述音頻數(shù)據(jù)的每一幀音頻信號(hào)的能量值的步驟,包括:根據(jù)如下公式計(jì)算所述能量值:POW_Y2(n)=sum(Y2(n)[k]);其中,所述n表示音頻信號(hào)的幀序號(hào),所述n大于或等于1,所述POW_Y2(n)表示第n幀的音頻信號(hào)的所述能量值,所述k表示音頻信號(hào)的各個(gè)頻率的編號(hào),所述Y2(n)[k]表示第n幀音頻信號(hào)的第k個(gè)頻率的能量值,所述Y2(n)表示第n幀音頻信號(hào)的各個(gè)頻率的能量值之和。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京達(dá)佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達(dá)佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911058911.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





