[發明專利]一種歌聲合成方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010122318.2 | 申請日: | 2020-02-27 |
| 公開(公告)號: | CN111402858A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 朱清影;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L13/033 | 分類號: | G10L13/033;G10L13/08;G10H1/00 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 黃章輝 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 歌聲 合成 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種歌聲合成方法,其特征在于,包括:
獲取語音數據;
對語音數據進行解析,得到所述語音數據對應的頻譜包絡、非周期指數、基頻輪廓和音素;
從預設的樂譜數據庫中獲取樂譜;
對所述樂譜中的音樂小節信息和所述基頻輪廓進行合成處理,得到合成處理后的第一基頻輪廓;
對所述基頻輪廓進行基頻控制處理,得到基頻控制處理后的第二基頻輪廓;
對所述第一基頻輪廓和所述第二基頻輪廓進行合成處理,得到目標基頻輪廓;
對所述頻譜包絡和所述非周期指數進行頻譜控制處理,得到目標頻譜包絡和目標非周期指數;
對所述音素進行變速處理,得到變速處理后的目標音素;
將所述目標頻譜包絡、目標非周期指數、目標音素和目標基頻輪廓進行合成處理,得到合成后的目標語音數據;
對所述目標語音數據進行頻譜控制處理,得到目標歌聲數據。
2.如權利要求1的歌聲合成方法,其特征在于,所述對基頻輪廓進行基頻控制處理,得到基頻控制處理后的第二基頻輪廓,包括以下步驟:
將所述基頻輪廓輸入到過沖二階阻尼模型中,得到過沖波動;
將所述基頻輪廓輸入到制備二階阻尼模型中,得到制備波動;
將所述基頻輪廓輸入到顫音二階震蕩模型中,得到顫音波動;
將過沖波動、制備波動、顫音波動合成到所述基頻輪廓中,得到初始基頻輪廓;
通過高通濾波器對所述初始基頻輪廓進行處理,得到細微波動;
將細微波動合成到所述初始基頻輪廓中,得到所述第二基頻輪廓。
3.如權利要求2的歌聲合成方法,其特征在于,所述通過高通濾波器對所述初始基頻輪廓進行處理,得到細微波動,包括以下步驟:
解析所述初始基頻輪廓,得到白噪聲和振幅;
通過高通濾波器對所述白噪聲進行高通濾波處理,得到高通濾波處理后的白噪聲;
對所述振幅進行歸一化處理,得到歸一化處理后的振幅;
基于所述高通濾波處理后的白噪聲和所述歸一化處理后的振幅,得到所述細微波動。
4.如權利要求1的歌聲合成方法,其特征在于,所述對所述頻譜包絡和所述非周期指數進行頻譜控制處理,得到頻譜控制處理后的目標頻譜包絡和目標非周期指數,包括以下步驟:
采用如下公式,對所述頻譜包絡進行計算,得到所述目標頻譜包絡:
Ssg(f)=Wsf(f)*Ssp(f);
其中,Ssg(f)為所述目標頻譜包絡,Ssp(f)為所述頻譜包絡,Wsf(f)為強調Ssp(f)共振峰的權重函數,f為頻率,其中,
ksf為調整強調度的增益,Fb為強調度的帶寬,Fs為Ssg(f)的峰值頻率;
采用如下公式,對所述非周期指數進行處理計算,得到所述目標非周期指數:
Qsg(f)=Psf(f)*Qsp(f);
其中,Qsg(f)為所述目標非周期指數,Qsp(f)為所述非周期指數,Psf(f)為強調Qsp(f)共振峰的權重函數,其中,
ksf為調整強調度的增益,Fb為強調度的帶寬,Qb為Qsp(f)的峰值頻率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122318.2/1.html,轉載請聲明來源鉆瓜專利網。





