[發(fā)明專(zhuān)利]一種音頻處理方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201310481839.7 | 申請(qǐng)日: | 2013-10-15 |
| 公開(kāi)(公告)號(hào): | CN104091591A | 公開(kāi)(公告)日: | 2014-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 趙偉峰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G10L15/02 | 分類(lèi)號(hào): | G10L15/02;G10L25/18;G10L25/21 |
| 代理公司: | 廣州三環(huán)專(zhuān)利代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強(qiáng) |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及音頻處理技術(shù)領(lǐng)域,尤其涉及一種音頻處理方法及裝置。
背景技術(shù)
副歌,通常指音頻文件(如歌曲、音樂(lè)等等)的高潮部分。以歌曲為例,一首歌曲通常采用AA’BA’Form(音樂(lè)結(jié)構(gòu)),A代表主歌,而B(niǎo)代表副歌;也即時(shí)說(shuō),通常一首歌曲由“前奏+兩段主歌+一段副歌+過(guò)門(mén)音樂(lè)+一段副歌+一段主歌+結(jié)尾音樂(lè)”按順序連接構(gòu)成。副歌定位對(duì)音頻文件的分析和處理起著重要作用,因此,如何在音頻文件中進(jìn)行副歌定位,成為音頻處理領(lǐng)域的一個(gè)亟待解決的重要問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種音頻處理方法及裝置,可以對(duì)音頻文件進(jìn)行副歌定位,提升音頻處理的智能性。
本發(fā)明第一方面提供一種音頻處理方法,可包括:
從待處理的音頻文件中選取區(qū)間音頻數(shù)據(jù);
構(gòu)建所述區(qū)間音頻數(shù)據(jù)的特征參數(shù)序列,所述特征參數(shù)序列包括能量序列和頻譜滾降序列;
根據(jù)所述區(qū)間音頻數(shù)據(jù)的特征參數(shù)序列,定位所述音頻文件的副歌。
本發(fā)明第二方面提供一種音頻處理裝置,可包括:
選取模塊,用于從待處理的音頻文件中選取區(qū)間音頻數(shù)據(jù);
構(gòu)建模塊,用于構(gòu)建所述區(qū)間音頻數(shù)據(jù)的特征參數(shù)序列,所述特征參數(shù)序列包括能量序列和頻譜滾降序列;
定位模塊,用于根據(jù)所述區(qū)間音頻數(shù)據(jù)的特征參數(shù)序列,定位所述音頻文件的副歌。
實(shí)施本發(fā)明實(shí)施例,具有如下有益效果:
本發(fā)明實(shí)施例可從待處理的音頻文件中選取區(qū)間音頻數(shù)據(jù),構(gòu)建區(qū)間音頻數(shù)據(jù)的特征參數(shù)序列,以實(shí)現(xiàn)音頻文件的副歌定位,提升了音頻處理的智能性;另外,由于僅需要從音頻文件中選取區(qū)間音頻數(shù)據(jù)進(jìn)行音頻處理,可有效提升音頻處理的效率,進(jìn)一步提升音頻處理的智能性。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種音頻處理方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的圖1所示的步驟S101的實(shí)施例的流程圖;
圖3為本發(fā)明實(shí)施例提供的圖1所示的步驟S102的實(shí)施例的部分流程圖;
圖4為本發(fā)明實(shí)施例提供的圖1所示的步驟S102的實(shí)施例的另一部分流程圖;
圖5為本發(fā)明實(shí)施例提供的圖1所示的步驟S103的實(shí)施例的流程圖;
圖6為本發(fā)明實(shí)施例提供的一種音頻處理裝置的結(jié)構(gòu)示意圖;
圖7為本發(fā)明實(shí)施例提供的選取模塊的實(shí)施例的結(jié)構(gòu)示意圖;
圖8為本發(fā)明實(shí)施例提供的構(gòu)建模塊的實(shí)施例的部分結(jié)構(gòu)示意圖;
圖9為本發(fā)明實(shí)施例提供的構(gòu)建模塊的實(shí)施例的另一部分結(jié)構(gòu)示意圖;
圖10為本發(fā)明實(shí)施例提供的定位模塊的實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例中,音頻文件可以包括但不限于:歌曲、歌曲片段、音樂(lè)、音樂(lè)片段、演奏樂(lè)、演奏樂(lè)片段、哼唱歌曲、哼唱歌曲片段等文件。本發(fā)明實(shí)施例的音頻處理方案可以應(yīng)用于互聯(lián)網(wǎng)領(lǐng)域的多個(gè)場(chǎng)景中,例如:可以應(yīng)用于對(duì)互聯(lián)網(wǎng)音頻庫(kù)中的音頻文件進(jìn)行分析處理的場(chǎng)景,包括:可應(yīng)用于主音查找的場(chǎng)景中進(jìn)行副歌的快速定位和準(zhǔn)確提取,也可應(yīng)用于哼唱搜索的場(chǎng)景中進(jìn)行副歌的快速定位和準(zhǔn)確提取,還可應(yīng)用于樂(lè)曲識(shí)別的場(chǎng)景中進(jìn)行副歌的快速定位和準(zhǔn)確提取等等;或者,可以應(yīng)用于對(duì)互聯(lián)網(wǎng)音頻庫(kù)中的音頻文件進(jìn)行試聽(tīng)的場(chǎng)景,包括:可提供副歌進(jìn)行在線播放或音樂(lè)下載前的試聽(tīng);或者,可以應(yīng)用于彩鈴下載或試聽(tīng)場(chǎng)景,包括:快速定位和準(zhǔn)確提取副歌,將副歌作為彩鈴提供給用戶進(jìn)行下載或試聽(tīng),等等。
下面將結(jié)合附圖1-附圖5,對(duì)本發(fā)明實(shí)施例提供的音頻處理方法進(jìn)行詳細(xì)介紹。需要說(shuō)明的是,附圖1-附圖5所示的音頻處理方法可以由本發(fā)明實(shí)施例提供的音頻處理裝置所執(zhí)行,該音頻處理裝置可運(yùn)行于終端設(shè)備或服務(wù)器中,其中,終端設(shè)備可包括但不限于:PC(Personal?Computer,個(gè)人計(jì)算機(jī))、PAD(平板電腦)、手機(jī)、智能手機(jī)、筆記本電腦等設(shè)備。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310481839.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





