[發(fā)明專利]一種音頻信號處理的方法及裝置有效
| 申請?zhí)枺?/td> | 201911072753.2 | 申請日: | 2019-11-05 |
| 公開(公告)號: | CN110782908B | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計)人: | 盤子圣;丁寧 | 申請(專利權(quán))人: | 廣州歡聊網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L25/03;G10L25/30;G10L25/45;G10L25/51;G10L25/87 |
| 代理公司: | 廣州佳睿知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44610 | 代理人: | 李健富 |
| 地址: | 510000 廣東省廣州市天*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 信號 處理 方法 裝置 | ||
本申請涉及一種音頻信號處理的方法及裝置,其中所述方法包括:獲取原唱音頻信號以及模仿音頻信號;分別對所述原唱音頻信號以及所述模仿音頻信號進(jìn)行特征提取,獲取所述原唱音頻信號對應(yīng)的第一特征幀序列,以及,所述模仿音頻信號對應(yīng)的第二特征幀序列;將所述第二特征幀序列與所述第一特征幀序列進(jìn)行幀對齊,生成幀對齊序列;檢測所述第一特征幀序列對應(yīng)的第一音節(jié)起始點序列,以及,所述第二特征幀序列對應(yīng)的第二音節(jié)起始點序列;基于所述第一音節(jié)起始點序列以及所述第二音節(jié)起始點序列,對所述幀對齊序列進(jìn)行調(diào)整;采用調(diào)整后的幀對齊序列對所述模仿音頻信號進(jìn)行音頻波形重建,并根據(jù)重建得到的音頻波形數(shù)據(jù)生成用于輸出的目標(biāo)音頻。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種音頻信號處理的方法及裝置。
背景技術(shù)
說唱(Rap)是目前流行的一種音樂形式,人們在聽別人演唱說唱音樂的同時,越來越希望能夠制作自己演唱的說唱音樂。但是,演唱說唱音樂往往需要演唱者具有一定的樂理知識以及唱歌技巧,演唱門檻較高。
發(fā)明內(nèi)容
鑒于上述問題,提出了本申請以便提供一種克服上述問題或者至少部分地解決上述問題的一種音頻信號處理的方法及裝置。
第一方面,本申請?zhí)峁┝艘环N語音信號處理的方法,所述方法包括:
獲取原唱音頻信號以及模仿音頻信號;
分別對所述原唱音頻信號以及所述模仿音頻信號進(jìn)行特征提取,獲取所述原唱音頻信號對應(yīng)的第一特征幀序列,以及,所述模仿音頻信號對應(yīng)的第二特征幀序列;
將所述第二特征幀序列與所述第一特征幀序列進(jìn)行幀對齊,生成幀對齊序列;
檢測所述第一特征幀序列對應(yīng)的第一音節(jié)起始點序列,以及,所述第二特征幀序列對應(yīng)的第二音節(jié)起始點序列;
基于所述第一音節(jié)起始點序列以及所述第二音節(jié)起始點序列,對所述幀對齊序列進(jìn)行調(diào)整;
采用調(diào)整后的幀對齊序列對所述模仿音頻信號進(jìn)行音頻波形重建,并根據(jù)重建得到的音頻波形數(shù)據(jù)生成用于輸出的目標(biāo)音頻。
可選地,所述檢測所述第一特征幀序列對應(yīng)的第一音節(jié)起始點序列,以及,所述第二特征幀序列對應(yīng)的第二音節(jié)起始點序列,包括:
分別將所述第一特征幀序列以及所述第二特征幀序列輸入已訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型,并獲取所述深度神經(jīng)網(wǎng)絡(luò)模型分別輸出的所述第一特征幀序列及所述第二特征幀序列中各幀為音節(jié)起始點的概率;
根據(jù)所述第一特征幀序列中各幀為音節(jié)起始點的概率,生成第一音節(jié)起始點概率曲線;
根據(jù)所述第二特征幀序列中各幀為音節(jié)起始點的概率,生成第二音節(jié)起始點概率曲線;
對所述第一音節(jié)起始點概率曲線進(jìn)行峰值檢測,并根據(jù)檢測出的峰值結(jié)果生成第一音節(jié)起始點序列;
對所述第二音節(jié)起始點概率曲線進(jìn)行峰值檢測,并根據(jù)檢測出的峰值結(jié)果生成第二音節(jié)起始點序列。
可選地,所述基于所述第一音節(jié)起始點序列以及所述第二音節(jié)起始點序列,對所述幀對齊序列進(jìn)行調(diào)整,包括:
遍歷所述第一音節(jié)起始點序列中各音節(jié)起始點,獲取該音節(jié)起始點的目標(biāo)幀號;
根據(jù)所述幀對齊序列,確定與所述目標(biāo)幀號對齊的對齊目標(biāo)幀號;
從所述第二音節(jié)起始點序列中查找所述對齊目標(biāo)幀號,以確定與所述對齊目標(biāo)幀號距離最近的目標(biāo)音節(jié)起始點;
若所述目標(biāo)音節(jié)起始點所在的幀號與所述對齊目標(biāo)幀號的距離在預(yù)設(shè)距離范圍內(nèi),則將所述幀對齊序列中的所述對齊目標(biāo)幀號調(diào)整為目標(biāo)音節(jié)起始點所在的幀號;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州歡聊網(wǎng)絡(luò)科技有限公司,未經(jīng)廣州歡聊網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911072753.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉(zhuǎn)HDMI信號的信號轉(zhuǎn)換線
- 信號盒(信號轉(zhuǎn)換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





