[發(fā)明專(zhuān)利]節(jié)奏點(diǎn)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910967555.6 | 申請(qǐng)日: | 2019-10-12 |
| 公開(kāi)(公告)號(hào): | CN110688518A | 公開(kāi)(公告)日: | 2020-01-14 |
| 發(fā)明(設(shè)計(jì))人: | 勞振鋒 | 申請(qǐng)(專(zhuān)利權(quán))人: | 廣州酷狗計(jì)算機(jī)科技有限公司 |
| 主分類(lèi)號(hào): | G06F16/63 | 分類(lèi)號(hào): | G06F16/63;G06F16/632;G06F16/68 |
| 代理公司: | 11138 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人: | 邢惠童 |
| 地址: | 510660 廣東省廣州*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 節(jié)奏 備選 音頻幀 時(shí)長(zhǎng) 采樣點(diǎn) 感知 數(shù)據(jù)處理技術(shù) 存儲(chǔ)介質(zhì) 準(zhǔn)確率 刪除 申請(qǐng) | ||
本申請(qǐng)公開(kāi)了一種節(jié)奏點(diǎn)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),屬于數(shù)據(jù)處理技術(shù)領(lǐng)域。該方法包括:獲取待處理的第一音頻的多個(gè)音頻幀,每個(gè)音頻幀包括多個(gè)采樣點(diǎn),基于節(jié)奏可感知時(shí)長(zhǎng),將多個(gè)音頻幀分成多組,每組包括至少一個(gè)音頻幀,第一音頻的音頻時(shí)長(zhǎng)包括多個(gè)節(jié)奏可感知時(shí)長(zhǎng),從每組內(nèi)的至少一個(gè)音頻幀包括的采樣點(diǎn)中,確定一個(gè)采樣點(diǎn)作為備選節(jié)奏點(diǎn),得到多個(gè)備選節(jié)奏點(diǎn),基于多個(gè)備選節(jié)奏點(diǎn),確定第一音頻的節(jié)奏點(diǎn)。如此,基于節(jié)奏可感知時(shí)長(zhǎng)在第一音頻中確定多個(gè)可能為音頻的節(jié)奏點(diǎn)的備選節(jié)奏點(diǎn),再對(duì)多個(gè)備選節(jié)奏點(diǎn)進(jìn)行處理,如刪除不能作為音頻的節(jié)奏點(diǎn)的備選節(jié)奏點(diǎn),進(jìn)而確定第一音頻的節(jié)奏點(diǎn),提高了確定音頻的節(jié)奏點(diǎn)的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種節(jié)奏點(diǎn)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
如今,節(jié)奏與人們?nèi)粘I畹穆?lián)系越來(lái)越緊密,譬如人們可以隨著音頻的節(jié)奏進(jìn)行運(yùn)動(dòng)、可以基于音頻的節(jié)奏設(shè)計(jì)出相應(yīng)的節(jié)奏游戲、可以設(shè)計(jì)燈光隨著音頻的節(jié)奏進(jìn)行閃爍等。為了獲取音頻的節(jié)奏,通常需要從音頻中確定節(jié)奏點(diǎn),所以在相關(guān)技術(shù)領(lǐng)域中,如何準(zhǔn)確地確定音頻的節(jié)奏點(diǎn)成為當(dāng)前亟需解決的問(wèn)題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種節(jié)奏點(diǎn)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),可以解決相關(guān)技術(shù)中節(jié)奏點(diǎn)的確定結(jié)果不準(zhǔn)確的問(wèn)題。所述技術(shù)方案如下:
一方面,提供了一種節(jié)奏點(diǎn)的確定方法,所述方法包括:
獲取待處理的第一音頻的多個(gè)音頻幀,每個(gè)音頻幀包括多個(gè)采樣點(diǎn);
基于節(jié)奏可感知時(shí)長(zhǎng),將所述多個(gè)音頻幀分成多組,每組包括至少一個(gè)音頻幀,所述第一音頻的音頻時(shí)長(zhǎng)包括多個(gè)所述節(jié)奏可感知時(shí)長(zhǎng);
從每組內(nèi)的至少一個(gè)音頻幀包括的采樣點(diǎn)中,確定一個(gè)采樣點(diǎn)作為備選節(jié)奏點(diǎn),得到多個(gè)備選節(jié)奏點(diǎn);
基于所述多個(gè)備選節(jié)奏點(diǎn),確定所述第一音頻的節(jié)奏點(diǎn)。
在本申請(qǐng)一種可能的實(shí)現(xiàn)方式中,當(dāng)每組內(nèi)包括多個(gè)音頻幀時(shí),所述從每組內(nèi)的至少一個(gè)音頻幀包括的采樣點(diǎn)中,確定一個(gè)采樣點(diǎn)作為備選節(jié)奏點(diǎn),包括:
對(duì)于多組中的任一組,基于所述任一組內(nèi)的多個(gè)音頻幀中每個(gè)音頻幀的音頻總能量,從所述任一組內(nèi)的多個(gè)音頻幀中確定多個(gè)目標(biāo)音頻幀;
從所述任一組內(nèi)的多個(gè)目標(biāo)音頻幀中選擇最大音頻能量的目標(biāo)音頻幀;
將選擇的目標(biāo)音頻幀內(nèi)的第一個(gè)采樣點(diǎn)確定為所述任一組的備選節(jié)奏點(diǎn)。
在本申請(qǐng)一種可能的實(shí)現(xiàn)方式中,所述從所述任一組內(nèi)的多個(gè)音頻幀中確定多個(gè)目標(biāo)音頻幀,包括:
對(duì)于所述任一組內(nèi)的多個(gè)音頻幀中的任一音頻幀,當(dāng)所述任一音頻幀的音頻總能量與相鄰的下一個(gè)音頻幀的音頻總能量之間的差值大于音頻能量閾值時(shí),從所述任一音頻幀和下一個(gè)音頻幀中選擇音頻總能量最大的音頻幀;
將選擇的音頻幀確定為所述任一組內(nèi)的多個(gè)音頻幀的一個(gè)目標(biāo)音頻幀。
在本申請(qǐng)一種可能的實(shí)現(xiàn)方式中,當(dāng)所述第一音頻中包括人聲時(shí),所述基于所述多個(gè)備選節(jié)奏點(diǎn),確定所述第一音頻的節(jié)奏點(diǎn),包括:
確定所述第一音頻中包括人聲的音頻部分;
將所述多個(gè)備選節(jié)奏點(diǎn)中除所述音頻部分對(duì)應(yīng)的備選節(jié)奏點(diǎn)之外的備選節(jié)奏點(diǎn)和所述音頻部分對(duì)應(yīng)的人聲采樣點(diǎn)確定為所述第一音頻的節(jié)奏點(diǎn),所述人聲采樣點(diǎn)是指存在人聲的音頻部分對(duì)應(yīng)的采樣點(diǎn)。
在本申請(qǐng)一種可能的實(shí)現(xiàn)方式中,所述獲取待處理的第一音頻的多個(gè)音頻幀之前,還包括:
對(duì)所述第一音頻進(jìn)行過(guò)濾處理,得到第二音頻,所述第二音頻的頻率大于等于第一預(yù)設(shè)頻率閾值且小于等于第二預(yù)設(shè)頻率閾值;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于廣州酷狗計(jì)算機(jī)科技有限公司,未經(jīng)廣州酷狗計(jì)算機(jī)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910967555.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 板卡主備配置的實(shí)現(xiàn)方法和板卡
- 用于智能問(wèn)答系統(tǒng)的答案排序方法及裝置
- 計(jì)算機(jī)實(shí)施的方法、輸入理解系統(tǒng)和計(jì)算機(jī)可讀存儲(chǔ)設(shè)備
- 備選框更新方法及裝置
- 設(shè)備選型方法
- 反應(yīng)選擇裝置、反應(yīng)選擇方法、以及反應(yīng)選擇系統(tǒng)
- 為特定車(chē)輛進(jìn)行路徑規(guī)劃的方法及裝置
- 一種區(qū)域軌道交通網(wǎng)絡(luò)化開(kāi)行方案?jìng)溥x集制定方法
- 一種面向繼電保護(hù)業(yè)務(wù)的路由分配方法及裝置
- 備選軌跡評(píng)價(jià)方法及裝置
- 控制遠(yuǎn)程服務(wù)調(diào)用頻率的方法和裝置
- 時(shí)長(zhǎng)記錄方法、藍(lán)牙從設(shè)備與時(shí)長(zhǎng)記錄系統(tǒng)
- 音素時(shí)長(zhǎng)預(yù)測(cè)建模方法及音素時(shí)長(zhǎng)預(yù)測(cè)方法
- 時(shí)長(zhǎng)顯示方法和時(shí)長(zhǎng)顯示裝置
- 預(yù)估接駕時(shí)長(zhǎng)方法及預(yù)估接駕時(shí)長(zhǎng)系統(tǒng)
- 一種監(jiān)控學(xué)生學(xué)習(xí)進(jìn)度的方法及終端
- 一種可根據(jù)不同人群調(diào)節(jié)交通信號(hào)燈時(shí)長(zhǎng)的系統(tǒng)
- 運(yùn)動(dòng)時(shí)長(zhǎng)測(cè)試器
- 配送時(shí)長(zhǎng)獲取、配送時(shí)長(zhǎng)預(yù)測(cè)模型生成的方法、裝置
- 物流運(yùn)單時(shí)效推送方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





