[發明專利]一種語音播放方法及計算機設備在審
| 申請號: | 202111678366.0 | 申請日: | 2021-12-31 |
| 公開(公告)號: | CN114495896A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 丁萬;黃東延;梁景俊 | 申請(專利權)人: | 深圳市優必選科技股份有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/10;G10L15/183;G10L19/04;G10L25/18;G10L25/30;G10L25/51;G06N3/04;G06N3/08 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 任敏 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 播放 方法 計算機 設備 | ||
本申請涉及人工智能技術領域,提供了一種語音播放方法、語音播放裝置、計算機設備及計算機可讀存儲介質。其中,一種語音播放方法,通過利用預設的韻律特征預測網絡,根據文本序列的文本特征進行韻律預測,得到文本序列的韻律特征,由于韻律特征能夠用于表征文本序列中單位文本內容的聲學特征,因此將文本特征與韻律特征作為聯合特征,輸入訓練后的聲學模型進行上下文依賴關系挖掘,使得輸出的梅爾頻譜能夠用于表征文本序列中單位文本內容的聲學特征、上下文依賴關系以及發音時機,最后基于梅爾頻譜播放與文本序列對應的語音內容,能夠在文本轉換為語音的場景中,提高語音質量。
技術領域
本發明屬于人工智能技術領域,尤其涉及一種語音播放方法、語音播放裝置、計算機設備及計算機可讀存儲介質。
背景技術
如今,隨著智能電子產品的普及,越來越多的電子設備具備語音交互功能。例如,智能音箱、智能讀書機等。相應地,對電子設備播放語音的質量要求也越來越高。
在現有技術中,電子設備在實現語音交互時,先將獲取到的文本文件轉換成語音文件后再進行播放。雖然,在將文本文件轉換成語音文件時,可以采樣已有的轉換模型將文本內容映射為語音內容,但是該方案僅是通過文本中各文字的音素進行對應映射,使得語音內容存在語氣相對平穩,也即語音質量不好,影響用戶體驗度。
發明內容
有鑒于此,本申請實施例提供了一種語音播放方法、語音播放裝置、計算機設備及計算機可讀存儲介質,以解決現有技術中語音播放方案在將文本轉換為語音后,存在語音質量不好的問題。
本申請實施例的第一方面提供了一種語音播放方法,包括:
利用訓練好的韻律特征預測網絡,根據文本序列的文本特征進行韻律預測,得到所述文本序列的韻律特征;
將所述文本特征與所述韻律特征作為聯合特征,輸入訓練后的聲學模型進行上下文依賴關系挖掘,輸出梅爾頻譜;
基于所述梅爾頻譜播放與所述文本序列對應的語音內容。
可選的,在所述利用訓練好的韻律特征預測網絡,根據文本序列的文本特征進行韻律預測,得到所述文本序列的韻律特征的步驟之前,還包括:
對文本序列樣本與所述文本序列樣本對應的語音樣本分別進行分析處理,得到相互關聯的文本樣本特征與語音樣本特征;
利用所述文本樣本特征與所述語音樣本特征作為第一訓練樣本,對韻律特征預測網絡進行訓練,得到訓練好的韻律特征預測網絡。
可選的,在所述將所述文本特征與所述韻律特征作為聯合特征,輸入訓練后的聲學模型進行上下文依賴關系挖掘,輸出梅爾頻譜的步驟之前,還包括:
利用所述文本樣本特征與所述語音樣本特征作為第二訓練樣本,對聲學模型進行訓練,得到訓練后的聲學模型。
可選的,所述利用訓練好的韻律特征預測網絡,根據文本序列的文本特征進行韻律預測,得到所述文本序列的韻律特征,包括:
通過長短時記憶網絡基于文本序列的編碼結果進行時間信息與上下文依賴關系抽取,得到所述文本序列的文本特征;其中,所述文本序列的編碼結果是利用深度神經網絡對文本序列進行編碼得到;所述文本特征攜帶有所述文本序列的音素信息;
利用訓練好的韻律特征預測網絡,基于所述文本特征攜帶的音素信息進行韻律預測,得到所述文本序列的韻律特征。
可選的,所述將所述文本特征與所述韻律特征作為聯合特征,輸入訓練后的聲學模型進行上下文依賴挖掘關系,輸出梅爾頻譜,包括:
為每一幀所述聯合特征拼接位置編碼,得到攜帶有位置編碼的聯合特征;
通過所述訓練后的聲學模型中的多頭注意力模塊,基于所述攜帶有位置編碼的聯合特征進行上下文依賴關系挖掘,輸出梅爾頻譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技股份有限公司,未經深圳市優必選科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111678366.0/2.html,轉載請聲明來源鉆瓜專利網。





