[發明專利]自動作曲方法、裝置和終端設備有效
| 申請號: | 201710175115.8 | 申請日: | 2017-03-22 |
| 公開(公告)號: | CN107045867B | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 何江聰;潘青華;胡國平;胡郁;劉慶峰 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10L25/03;G10L25/30;G10L25/48 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 作曲 方法 裝置 終端設備 | ||
1.一種自動作曲方法,其特征在于,包括:
接收待預測前段音樂的音樂文件,所述待預測前段音樂的音樂文件包括所述待預測前段音樂的音頻數據或音樂描述信息;
提取所述音樂文件對應音樂的幀級音頻特征;
根據所述幀級音頻特征和預先構建的音樂頻帶特征結合模型,獲得攜帶頻帶信息的幀級音頻特征,所述音樂頻帶特征結合模型是根據音頻文件的幀級音頻特征和音樂頻帶特征結合模型的拓撲結構訓練得到的;
根據所述攜帶頻帶信息的幀級音頻特征和預先構建的音樂預測模型,獲得預測出的音樂,以實現自動作曲,所述音樂預測模型是根據所述音樂頻帶特征結合模型的輸出和音樂預測模型的拓撲結構訓練得到的。
2.根據權利要求1所述的方法,其特征在于,所述根據所述幀級音頻特征和預先構建的音樂頻帶特征結合模型,獲得攜帶頻帶信息的幀級音頻特征之前,還包括:
收集音樂文件,并將所述音樂文件轉換為相同格式的音頻文件;
提取所述音頻文件的幀級音頻特征;
確定音樂頻帶特征結合模型的拓撲結構;
根據確定的拓撲結構和所述幀級音頻特征,訓練所述音樂頻帶特征結合模型。
3.根據權利要求2所述的方法,其特征在于,所述提取所述音頻文件的幀級音頻特征包括:
將所述音頻文件按幀進行固定點數的快速傅里葉變換;
根據快速傅里葉變換的結果計算所述音頻文件的每幀在每個頻率點的能量值;
根據所述能量值確定每幀的音符歸屬;
計算每個音符的能量值,根據每個音符的能量值獲取幀級音頻特征。
4.根據權利要求3所述的方法,其特征在于,所述根據所述能量值確定每幀的音符歸屬包括:
在每個頻率點,確定所述音頻文件的第一幀和第二幀屬于第一個音符;
判斷第一差值的絕對值是否小于第二差值;所述第一差值為所述音頻文件的第三幀的能量值與所述音頻文件的第一幀到第二幀能量值的平均值之差,所述第二差值為所述音頻文件的第一幀到第二幀能量值的最大值與最小值之差;
如果是,則確定所述音頻文件的第三幀屬于第一個音符,再依次向后判斷第四幀直至最后一幀的音符歸屬。
5.根據權利要求4所述的方法,其特征在于,所述判斷第一差值的絕對值是否小于第二差值的絕對值之后,還包括:
如果所述第一差值的絕對值大于或等于所述第二差值,則將所述音頻文件的第三幀作為第二個音符的開始,并確定所述音頻文件的第四幀屬于所述第二個音符;
從所述音頻文件的第五幀開始判斷第三差值的絕對值是否小于第四差值,所述第三差值為所述音頻文件的第五幀的能量值與所述音頻文件的第三幀到第四幀能量值的平均值之差,所述第四差值為所述音頻文件的第三幀到第四幀能量值的最大值與最小值之差;直至將所述音頻文件的最后一幀的音符歸屬確定完畢。
6.根據權利要求3所述的方法,其特征在于,所述計算每個音符的能量值,根據每個音符的能量值獲取幀級音頻特征包括:
計算每個音符所含所有幀的能量均值,作為每個音符的能量值;
將每個音符所包括的每幀的能量值歸一化為所屬音符的能量值;
濾除能量值小于預定閾值的音符,以獲得幀級音頻特征。
7.根據權利要求1所述的方法,其特征在于,所述根據所述攜帶頻帶信息的幀級音頻特征和預先構建的音樂預測模型,獲得預測出的音樂之前,還可以包括:
確定音樂預測模型的拓撲結構;
根據所述音樂頻帶特征結合模型的輸出,以及確定的拓撲結構,訓練所述音樂預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710175115.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:差分信號傳輸電路和顯示裝置
- 下一篇:一種局域共振型聲子晶體周期涂層結構





