[發明專利]歌聲生成方法、裝置、設備及存儲介質有效

申請號：	201910864720.5	申請日：	2019-09-12
公開（公告）號：	CN110600034B	公開（公告）日：	2021-12-03
發明（設計）人：	張超鋼;陳傳藝	申請（專利權）人：	廣州酷狗計算機科技有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10H1/00
代理公司：	北京三高永信知識產權代理有限責任公司 11138	代理人：	邢惠童
地址：	510660 廣東省廣州***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	歌聲生成方法裝置設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種歌聲生成方法、裝置、設備及存儲介質，屬于音頻處理技術領域。所述方法包括：當獲取到用戶語音時，對所述用戶語音進行識別；當識別出的文字與第一參考歌聲中的文字非完全相同時，獲取所述用戶語音的第一音頻特征和第二參考歌聲的第二音頻特征，所述第二參考歌聲為所述第一參考歌聲或對所述第一參考歌聲進行變調處理得到的參考歌聲；根據所述第一音頻特征和所述第二音頻特征，確定所述用戶語音中的文字；根據所述第一參考歌聲中的文字，對確定的所述用戶語音中的文字進行變速處理和變調處理，生成用戶歌聲。本申請可以解決文字識別錯誤或遺漏時導致文字無法對齊，因而無法生成用戶歌聲的問題。

技術領域

本申請涉及音頻處理技術領域，尤其涉及一種歌聲生成方法、裝置、設備及存儲介質。

背景技術

隨著音頻處理技術的發展，音頻處理技術逐漸應用于人們的日常生活中，例如，有些用戶唱歌五音不全，希望可以念出歌詞，然后生成自己的歌聲。

相關技術一般是對用戶說話的語音進行識別，然后將識別出的文字與參考歌聲的文字進行對齊、變速和變調，從而生成用戶歌聲。

在實際使用場景中，由于噪聲、混響等環境因素，很容易造成文字識別錯誤或遺漏，導致識別出的文字與參考歌聲中的文字非完全相同，這樣使得文字無法對齊，因而無法生成用戶歌聲。

發明內容

本申請實施例提供了一種歌聲生成方法、裝置、設備及存儲介質，可以解決相關技術中文字識別錯誤或遺漏時無法生成用戶歌聲的問題。所述技術方案如下：

第一方面，提供一種歌聲生成方法，包括：

當獲取到用戶語音時，對所述用戶語音進行識別；

當識別出的文字與第一參考歌聲中的文字非完全相同時，獲取所述用戶語音的第一音頻特征和第二參考歌聲的第二音頻特征，所述第二參考歌聲為所述第一參考歌聲或對所述第一參考歌聲進行變調處理得到的參考歌聲；

根據所述第一音頻特征和所述第二音頻特征，確定所述用戶語音中的文字；