[發明專利]拼接語音音頻的方法、裝置以及存儲介質在審
| 申請號: | 201910913308.8 | 申請日: | 2019-09-25 |
| 公開(公告)號: | CN112562637A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 黃磊;楊春勇;權圣 | 申請(專利權)人: | 北京中關村科金技術有限公司 |
| 主分類號: | G10L13/033 | 分類號: | G10L13/033 |
| 代理公司: | 北京萬思博知識產權代理有限公司 11694 | 代理人: | 劉冀 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 拼接 語音 音頻 方法 裝置 以及 存儲 介質 | ||
本申請公開了一種拼接語音音頻的方法、裝置以及存儲介質。其中,該方法包括:獲取用于拼接的第一語音音頻和第二語音音頻;生成過渡音頻,過渡音頻用于銜接第一語音音頻和第二語音音頻;以及將過渡音頻插入到第一語音音頻和第二語音音頻之間,并且將第一語音音頻、過渡音頻以及第二語音音頻進行拼接,生成拼接語音音頻。解決了語音合成過程中需要對音頻片段進行拼接,由于音頻片段的拼接處不夠平滑,因此與真人錄音相比自然度較差的技術問題。
技術領域
本申請涉及計算機和人工智能領域,特別是涉及一種拼接語音音頻的方法、裝置以及存儲介質。
背景技術
目前TTS(Text To Speech)的拼接合成技術是通過將錄音員所錄的錄音,根據標注格式,切割成一段一段的錄音,當合成文本傳入后,會根據單元挑選合適的錄音進行拼接合成。例如合成人名張三,錄音庫里面分別存了‘張’、‘三’,通過合成這兩個字來生成‘張三’的音頻。雖然這種合成方式在整體上會顯得比較自然,但是在切割處拼接的時候會存在過渡不夠平滑的問題,主要體現在姓名的合成上。現有技術一般采用TD-PSOLA算法解決這個問題,而TD-PSOLA算法在拼接過程中出現聲音信號值較多的情況使用效果不佳,此外還存在合成不自然的問題,因此合成語音的自然度跟真人錄音相比效果比較差。
針對上述的現有技術中存在的語音合成過程中需要對音頻片段進行拼接,由于音頻片段的拼接處不夠平滑,因此與真人錄音相比自然度較差的技術問題,目前尚未提出有效的解決方案。
發明內容
本公開的實施例提供了一種拼接語音音頻的方法、裝置以及存儲介質,以至少解決現有技術中存在的文字轉語音的過程中需要進行音頻片段的拼接,由于音頻片段的拼接處不夠平滑,因此與真人錄音相比自然度較差的技術問題。
根據本公開實施例的一個方面,提供了一種拼接語音音頻的方法,包括:獲取用于拼接的第一語音音頻和第二語音音頻;生成過渡音頻,過渡音頻用于銜接第一語音音頻和第二語音音頻;以及將過渡音頻插入到第一語音音頻和第二語音音頻之間,并且將第一語音音頻、過渡音頻以及第二語音音頻進行拼接,生成拼接語音音頻。
根據本公開實施例的另一個方面,還提供了一種存儲介質,存儲介質包括存儲的程序,其中,在程序運行時由處理器執行以上任意一項所述的方法。
根據本公開實施例的另一個方面,還提供了一種拼接語音音頻的裝置,包括:獲取模塊,用于獲取用于拼接的第一語音音頻和第二語音音頻;生成模塊,用于生成過渡音頻,過渡音頻用于銜接第一語音音頻和第二語音音頻;以及拼接模塊,用于將過渡音頻插入到第一語音音頻和第二語音音頻之間,并且將第一語音音頻、過渡音頻以及第二語音音頻進行拼接,生成拼接語音音頻。
根據本公開實施例的另一個方面,還提供了一種拼接語音音頻的裝置,包括:處理器;以及存儲器,與處理器連接,用于為處理器提供處理以下處理步驟的指令:獲取用于拼接的第一語音音頻和第二語音音頻;生成過渡音頻,過渡音頻用于銜接第一語音音頻和第二語音音頻;以及將過渡音頻插入到第一語音音頻和第二語音音頻之間,并且將第一語音音頻、過渡音頻以及第二語音音頻進行拼接,生成拼接語音音頻。
在本公開實施例中,通過獲取用于拼接的兩個音頻片段,然后生成用于平滑銜接兩個音頻片段的過渡音頻,最終將所生成的過渡音頻插入到兩個音頻片段之間,生成拼接語音音頻。達到了在語音合成過程中可以平滑拼接連續的兩個音頻片段的目的,從而實現了增強合成語音的自然度和協調性,降低合成語音存在的機械感的技術效果。進而解決了現有技術中存在的語音合成過程中需要對音頻片段進行拼接,由于音頻片段的拼接處不夠平滑,因此與真人錄音相比自然度較差的技術問題。
附圖說明
此處所說明的附圖用來提供對本公開的進一步理解,構成本申請的一部分,本公開的示意性實施例及其說明用于解釋本公開,并不構成對本公開的不當限定。在附圖中:
圖1是用于實現根據本公開實施例1所述的方法的計算設備的硬件結構框圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中關村科金技術有限公司,未經北京中關村科金技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910913308.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:活體檢測方法、裝置以及存儲介質
- 下一篇:檢測裝置及檢測方法





