[發明專利]一種語音轉化成歌曲的方法和系統有效
| 申請號: | 202011207626.1 | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112397043B | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 北京中科深智科技有限公司 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10L21/007;G10L25/24;G10L25/03 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100000 北京市豐臺區航*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 轉化 歌曲 方法 系統 | ||
1.一種語音轉化成歌曲的方法,其特征在于,包括以下內容:
對語音信號進行處理,并轉化成mel(梅爾)譜圖;
通過聲旋律提取器從不同的聲源提取F0輪廓;
將mel譜圖時間拉伸到與F0輪廓相同的長度,并通過兩個編碼器分別對mel譜圖和F0輪廓進行編碼,包括:
對mel譜圖進行隨機分割,并沿著時間軸拉伸或擠壓每個片段,以與F0輪廓相同長度,具體為:
將mel譜圖分割成16-32幀的隨機長度的片段,并將每個片段以0.5-2的倍數進行時間拉伸或擠壓,以與F0輪廓相同長度;
通過解碼器將編碼后的mel譜圖和F0輪廓進行關聯,并生成歌曲譜圖;
通過MelGAN聲碼器對歌曲譜圖進行處理,以提高輸出歌曲的音質。
2.根據權利要求1所述一種語音轉化成歌曲的方法,其特征在于,所述對語音信號進行處理,并轉化成mel譜圖,其中,對語音信號進行處理,包括以下內容:
對語音信號進行多次重新采樣,并改變語音信號的節奏,以有效分離語音信號的內容和節奏。
3.根據權利要求1所述一種語音轉化成歌曲的方法,其特征在于,所述通過聲旋律提取器從不同的聲源提取F0輪廓,其中,聲源包括哼唱和演唱。
4.一種語音轉化成歌曲的系統,其特征在于,包括:
語音處理模塊,用于對語音信號進行處理,并轉化成mel譜圖;
聲源處理模塊,用于通過聲旋律提取器從不同的聲源提取F0輪廓;
編碼模塊,用于將mel譜圖時間拉伸到與F0輪廓相同的長度,并通過兩個編碼器分別對mel譜圖和F0輪廓進行編碼;
編碼模塊,包括:
拉伸模塊,用于對mel譜圖進行隨機分割,并沿著時間軸拉伸或擠壓每個片段,以與F0輪廓相同長度,具體為:
將mel譜圖分割成16-32幀的隨機長度的片段,并將每個片段以0.5-2的倍數進行時間拉伸或擠壓,以與F0輪廓相同長度;
解碼模塊,用于通過解碼器將編碼后的mel譜圖和F0輪廓進行關聯,并生成歌曲譜圖;
輸出模塊,用于通過MelGAN聲碼器對歌曲譜圖進行處理,以提高輸出歌曲的音質。
5.根據權利要求4所述一種語音轉化成歌曲的系統,其特征在于,語音處理模塊,包括:
語音采樣模塊,用于對語音信號進行多次重新采樣,并改變語音信號的節奏,以有效分離語音信號的內容和節奏。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科深智科技有限公司,未經北京中科深智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011207626.1/1.html,轉載請聲明來源鉆瓜專利網。





