[發(fā)明專利]節(jié)奏點(diǎn)的確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910967555.6 | 申請(qǐng)日: | 2019-10-12 |
| 公開(kāi)(公告)號(hào): | CN110688518A | 公開(kāi)(公告)日: | 2020-01-14 |
| 發(fā)明(設(shè)計(jì))人: | 勞振鋒 | 申請(qǐng)(專利權(quán))人: | 廣州酷狗計(jì)算機(jī)科技有限公司 |
| 主分類號(hào): | G06F16/63 | 分類號(hào): | G06F16/63;G06F16/632;G06F16/68 |
| 代理公司: | 11138 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人: | 邢惠童 |
| 地址: | 510660 廣東省廣州*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 節(jié)奏 備選 音頻幀 時(shí)長(zhǎng) 采樣點(diǎn) 感知 數(shù)據(jù)處理技術(shù) 存儲(chǔ)介質(zhì) 準(zhǔn)確率 刪除 申請(qǐng) | ||
1.一種節(jié)奏點(diǎn)的確定方法,其特征在于,所述方法包括:
獲取待處理的第一音頻的多個(gè)音頻幀,每個(gè)音頻幀包括多個(gè)采樣點(diǎn);
基于節(jié)奏可感知時(shí)長(zhǎng),將所述多個(gè)音頻幀分成多組,每組包括至少一個(gè)音頻幀,所述第一音頻的音頻時(shí)長(zhǎng)包括多個(gè)所述節(jié)奏可感知時(shí)長(zhǎng);
從每組內(nèi)的至少一個(gè)音頻幀包括的采樣點(diǎn)中,確定一個(gè)采樣點(diǎn)作為備選節(jié)奏點(diǎn),得到多個(gè)備選節(jié)奏點(diǎn);
基于所述多個(gè)備選節(jié)奏點(diǎn),確定所述第一音頻的節(jié)奏點(diǎn)。
2.如權(quán)利要求1所述的方法,其特征在于,當(dāng)每組內(nèi)包括多個(gè)音頻幀時(shí),所述從每組內(nèi)的至少一個(gè)音頻幀包括的采樣點(diǎn)中,確定一個(gè)采樣點(diǎn)作為備選節(jié)奏點(diǎn),包括:
對(duì)于多組中的任一組,基于所述任一組內(nèi)的多個(gè)音頻幀中每個(gè)音頻幀的音頻總能量,從所述任一組內(nèi)的多個(gè)音頻幀中確定多個(gè)目標(biāo)音頻幀;
從所述任一組內(nèi)的多個(gè)目標(biāo)音頻幀中選擇最大音頻能量的目標(biāo)音頻幀;
將選擇的目標(biāo)音頻幀內(nèi)的第一個(gè)采樣點(diǎn)確定為所述任一組的備選節(jié)奏點(diǎn)。
3.如權(quán)利要求2所述的方法,其特征在于,所述從所述任一組內(nèi)的多個(gè)音頻幀中確定多個(gè)目標(biāo)音頻幀,包括:
對(duì)于所述任一組內(nèi)的多個(gè)音頻幀中的任一音頻幀,當(dāng)所述任一音頻幀的音頻總能量與相鄰的下一個(gè)音頻幀的音頻總能量之間的差值大于音頻能量閾值時(shí),從所述任一音頻幀和下一個(gè)音頻幀中選擇音頻總能量最大的音頻幀;
將選擇的音頻幀確定為所述任一組內(nèi)的多個(gè)音頻幀的一個(gè)目標(biāo)音頻幀。
4.如權(quán)利要求1所述的方法,其特征在于,當(dāng)所述第一音頻中包括人聲時(shí),所述基于所述多個(gè)備選節(jié)奏點(diǎn),確定所述第一音頻的節(jié)奏點(diǎn),包括:
確定所述第一音頻中包括人聲的音頻部分;
將所述多個(gè)備選節(jié)奏點(diǎn)中除所述音頻部分對(duì)應(yīng)的備選節(jié)奏點(diǎn)之外的備選節(jié)奏點(diǎn)和所述音頻部分對(duì)應(yīng)的人聲采樣點(diǎn)確定為所述第一音頻的節(jié)奏點(diǎn),所述人聲采樣點(diǎn)是指存在人聲的音頻部分對(duì)應(yīng)的采樣點(diǎn)。
5.如權(quán)利要求1所述的方法,其特征在于,所述獲取待處理的第一音頻的多個(gè)音頻幀之前,還包括:
對(duì)所述第一音頻進(jìn)行過(guò)濾處理,得到第二音頻,所述第二音頻的頻率大于等于第一預(yù)設(shè)頻率閾值且小于等于第二預(yù)設(shè)頻率閾值;
相應(yīng)地,所述獲取待處理的第一音頻的多個(gè)音頻幀,包括:
獲取所述第二音頻的多個(gè)音頻幀。
6.如權(quán)利要求1所述的方法,其特征在于,所述基于所述多個(gè)備選節(jié)奏點(diǎn),確定所述第一音頻的節(jié)奏點(diǎn),包括:
當(dāng)所述多個(gè)備選節(jié)奏點(diǎn)中存在相鄰兩個(gè)備選節(jié)奏點(diǎn)之間的時(shí)長(zhǎng)小于所述節(jié)奏可感知時(shí)長(zhǎng)時(shí),將所述相鄰兩個(gè)備選節(jié)奏點(diǎn)中音頻能量小的備選節(jié)奏點(diǎn)刪除;
當(dāng)刪除后剩余的多個(gè)備選節(jié)奏點(diǎn)中不存在相鄰兩個(gè)備選節(jié)奏點(diǎn)之間的時(shí)長(zhǎng)小于所述節(jié)奏可感知時(shí)長(zhǎng)時(shí),將刪除后剩余的多個(gè)備選節(jié)奏點(diǎn)確定為所述第一音頻的節(jié)奏點(diǎn)。
7.一種節(jié)奏點(diǎn)的確定裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取待處理的第一音頻的多個(gè)音頻幀,每個(gè)音頻幀包括多個(gè)采樣點(diǎn);
分組模塊,用于基于節(jié)奏可感知時(shí)長(zhǎng),將所述多個(gè)音頻幀分成多組,每組包括至少一個(gè)音頻幀,所述第一音頻的音頻時(shí)長(zhǎng)包括多個(gè)所述節(jié)奏可感知時(shí)長(zhǎng);
備選節(jié)奏點(diǎn)確定模塊,用于從每組內(nèi)的至少一個(gè)音頻幀包括的采樣點(diǎn)中,確定一個(gè)采樣點(diǎn)作為備選節(jié)奏點(diǎn),得到多個(gè)備選節(jié)奏點(diǎn);
節(jié)奏點(diǎn)確定模塊,用于基于所述多個(gè)備選節(jié)奏點(diǎn),確定所述第一音頻的節(jié)奏點(diǎn)。
8.如權(quán)利要求7所述的裝置,其特征在于,當(dāng)每組內(nèi)包括多個(gè)音頻幀時(shí),所述備選節(jié)奏點(diǎn)確定模塊用于:
對(duì)于多組中的任一組,基于所述任一組內(nèi)的多個(gè)音頻幀中每個(gè)音頻幀的音頻總能量,從所述任一組內(nèi)的多個(gè)音頻幀中確定多個(gè)目標(biāo)音頻幀;
從所述任一組內(nèi)的多個(gè)目標(biāo)音頻幀中選擇最大音頻能量的目標(biāo)音頻幀;
將選擇的目標(biāo)音頻幀內(nèi)的第一個(gè)采樣點(diǎn)確定為所述任一組的備選節(jié)奏點(diǎn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州酷狗計(jì)算機(jī)科技有限公司,未經(jīng)廣州酷狗計(jì)算機(jī)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910967555.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 板卡主備配置的實(shí)現(xiàn)方法和板卡
- 用于智能問(wèn)答系統(tǒng)的答案排序方法及裝置
- 計(jì)算機(jī)實(shí)施的方法、輸入理解系統(tǒng)和計(jì)算機(jī)可讀存儲(chǔ)設(shè)備
- 備選框更新方法及裝置
- 設(shè)備選型方法
- 反應(yīng)選擇裝置、反應(yīng)選擇方法、以及反應(yīng)選擇系統(tǒng)
- 為特定車輛進(jìn)行路徑規(guī)劃的方法及裝置
- 一種區(qū)域軌道交通網(wǎng)絡(luò)化開(kāi)行方案?jìng)溥x集制定方法
- 一種面向繼電保護(hù)業(yè)務(wù)的路由分配方法及裝置
- 備選軌跡評(píng)價(jià)方法及裝置
- 控制遠(yuǎn)程服務(wù)調(diào)用頻率的方法和裝置
- 時(shí)長(zhǎng)記錄方法、藍(lán)牙從設(shè)備與時(shí)長(zhǎng)記錄系統(tǒng)
- 音素時(shí)長(zhǎng)預(yù)測(cè)建模方法及音素時(shí)長(zhǎng)預(yù)測(cè)方法
- 時(shí)長(zhǎng)顯示方法和時(shí)長(zhǎng)顯示裝置
- 預(yù)估接駕時(shí)長(zhǎng)方法及預(yù)估接駕時(shí)長(zhǎng)系統(tǒng)
- 一種監(jiān)控學(xué)生學(xué)習(xí)進(jìn)度的方法及終端
- 一種可根據(jù)不同人群調(diào)節(jié)交通信號(hào)燈時(shí)長(zhǎng)的系統(tǒng)
- 運(yùn)動(dòng)時(shí)長(zhǎng)測(cè)試器
- 配送時(shí)長(zhǎng)獲取、配送時(shí)長(zhǎng)預(yù)測(cè)模型生成的方法、裝置
- 物流運(yùn)單時(shí)效推送方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





