[發明專利]一種語音轉化成歌曲的方法和系統有效
| 申請號: | 202011207626.1 | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112397043B | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 北京中科深智科技有限公司 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10L21/007;G10L25/24;G10L25/03 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100000 北京市豐臺區航*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 轉化 歌曲 方法 系統 | ||
本發明公開了一種語音轉化成歌曲的方法,包括以下內容:對語音信號進行處理,并轉化成mel譜圖;通過聲旋律提取器從不同的聲源提取F0輪廓;將mel譜圖時間拉伸到與F0輪廓相同的長度,并通過兩個編碼器分別對mel譜圖和F0輪廓進行編碼;通過解碼器將編碼后的mel譜圖和F0輪廓進行關聯,并生成歌曲譜圖;通過MelGAN聲碼器對歌曲譜圖進行處理,以提高輸出歌曲的音質。本發明還公開了一種語音轉化成歌曲的系統。本發明能夠有效提高歌曲音質,提高用戶體驗。
技術領域
本發明涉及語音信號處理技術領域,特別涉及一種語音轉化成歌曲的方法和系統。
背景技術
目前,在娛樂、卡拉ok、音樂制作等方面有歌曲合成的應用需求。歌曲合成是在一定條件下,例如:歌詞、音高標簽或參考音頻,創建自然的歌曲。其中,參考音頻可以是一個人的歌唱段落,任務是將歌唱段落的音色轉換成另一個人的音色。參考音頻也可以是某人的一段語音,其任務是將其轉換為具有相同音色身份和語言內容的歌唱段落,而不參考其基礎音素序列。
但是,現有技術中的歌曲合成方法所生成的歌曲聲音失真、不自然,大大降低了用戶體驗。
發明內容
本發明的目的在于提供一種語音轉化成歌曲的方法和系統,以解決上述技術問題。
為達此目的,本發明采用以下技術方案:
提供一種語音轉化成歌曲的方法,包括以下內容:
對語音信號進行處理,并轉化成mel譜圖;
通過聲旋律提取器從不同的聲源提取F0輪廓;
將mel譜圖時間拉伸到與F0輪廓相同的長度,并通過兩個編碼器分別對mel譜圖和F0輪廓進行編碼;
通過解碼器將編碼后的mel譜圖和F0輪廓進行關聯,并生成歌曲譜圖;
通過MelGAN聲碼器對歌曲譜圖進行處理,以提高輸出歌曲的音質。
本發明還提供一種語音轉化成歌曲的系統,包括:
語音處理模塊,用于對語音信號進行處理,并轉化成mel譜圖;
聲源處理模塊,用于通過聲旋律提取器從不同的聲源提取F0輪廓;
編碼模塊,用于將mel譜圖時間拉伸到與F0輪廓相同的長度,并通過兩個編碼器分別對mel譜圖和F0輪廓進行編碼;
解碼模塊,用于通過解碼器將編碼后的mel譜圖和F0輪廓進行關聯,并生成歌曲譜圖;
輸出模塊,用于通過MelGAN聲碼器對歌曲譜圖進行處理,以提高輸出歌曲的音質。
1.本發明通過設置編碼器和解碼器將語音轉化成歌曲,且對轉換后的歌曲通過MelGAN聲碼器進行處理,避免了現有技術中通過參考音頻進行語音到歌曲轉換而導致歌曲聲音失真、不自然的缺陷。
2.本發明由于通過MelGAN聲碼器對歌曲譜圖進行處理,而MelGAN具有顯著的效率和通用性,因此,能夠有效提高音質。
附圖說明
為了更清楚地說明本發明實施例的技術方案,下面將對本發明實施例中所需要使用的附圖作簡單地介紹。顯而易見地,下面所描述的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明一實施例提供的語音轉化成歌曲的方法的步驟圖;
圖2是本發明一實施例提供的語音轉化成歌曲的系統的結構示意圖。
具體實施方式
下面結合附圖并通過具體實施方式來進一步說明本發明的技術方案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科深智科技有限公司,未經北京中科深智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011207626.1/2.html,轉載請聲明來源鉆瓜專利網。





