[發明專利]用于語音合成語料庫的建立方法、裝置、設備和介質在審
| 申請號: | 202110616148.8 | 申請日: | 2021-06-02 |
| 公開(公告)號: | CN113362800A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 石強;孫見青;梁家恩 | 申請(專利權)人: | 深圳云知聲信息技術有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/04;G10L15/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 語音 合成 語料庫 建立 方法 裝置 設備 介質 | ||
本發明涉及一種用于語音合成語料庫的建立方法、裝置、設備和介質,該方法包括:獲取第一文本以及第一文本對應的語音數據;切分語音數據得到分割語料;所述分割語料得到第二文本;對比第二文本和第一文本,篩選得到篩選文本;根據篩選文本確定篩選音頻;提取篩選音頻的基頻值;計算基頻值的均值和方差;聚類均值和方差得到聚類結果;根據聚類結果將篩選文本及其對應的語音數據分成k個語料庫。本申請實施例中采取先切分后識別的方式,可以提高文本識別準確率,并且將獲取得到的第一文本作為參考去除識別錯誤的情況;由于基頻與語音風格和音色具有強相關性,使用句子級的基頻均值方差進行分類,有效的保證類內語音風格與音色的一致性。
技術領域
本發明涉及語料庫技術領域,具體涉及一種用于語音合成語料庫的建立方法、裝置、設備和介質。
背景技術
目前,語料庫錄制存在成本高、制作周期長、難度大等問題。但直接使用網絡爬取的語音數據,其中含有大量質量并不能滿足合成模型訓練的數據質量要求的數據。當前常見的自動化構建音庫的方法,對爬取語音進行語音識別獲得識別文本,根據識別文本將語音切分成符合長度要求的短句,最后將切割后的音頻和對應文本作為語庫中的語料。
一個合格的用于語音合成模型訓練的語料庫,通常需要滿足如下要求:1、語音和文本需要有高度的字音一致性;2、同一發音人所有語音在音色、風格、音質等語音學指標上要保持一致;3、每條語音的長度要保持在一定的字數區間,不可過長或者過短。而上述方法由于識別模型存在誤差,所以要求1中內容不能得到有效保證。同時無法通過方法對語音的語言學穩定性進行評估,導致要求2中的內容不能得到滿足。
發明內容
本發明提供一種用于語音合成語料庫的建立方法、裝置、設備和介質,能夠解決語音文本字音一致性差、音色、風格、音質上的一致性較差的技術問題。
本發明解決上述技術問題的技術方案如下:
第一方面,本發明實施例提供了一種用于語音合成語料庫的建立方法,包括:獲取第一文本以及第一文本對應的語音數據;切分所述語音數據得到分割語料;識別所述分割語料得到第二文本;對比第二文本和第一文本,篩選得到篩選文本;根據篩選文本確定篩選音頻;提取篩選音頻的基頻值;計算句子級基頻值的均值和方差;聚類均值和方差得到聚類結果;根據聚類結果將所述篩選文本及其對應的語音數據分成k個語料庫。
在一些實施例中,上述方法中切分所述語音數據得到分割語料,包括:
通過語音活動檢測算法切分所述語音數據得到分割語料。
在一些實施例中,上述方法中對比第二文本和第一文本,篩選得到篩選文本,包括:
根據對比的字數和準確率進行篩選。
在一些實施例中,上述方法還包括:
將k個語料庫使用不同的style-id進行區分。
在一些實施例中,上述方法中識別分割語料得到第二文本,包括:采用自動識別語音技術識別分割語料得到第二文本。
第二方面,本發明實施例還提供了一種用于語音合成語料庫的建立裝置,包括:獲取模塊:用于獲取第一文本以及第一文本對應的語音數據;切分模塊:用于切分語音數據得到分割語料;識別模塊:用于識別分割語料得到第二文本;對比模塊:用于對比第二文本和所述第一文本,篩選得到篩選文本;確定模塊:根據篩選文本確定篩選音頻;提取模塊:用于提取篩選音頻的基頻值;計算模塊:用于計算句子級基頻值的均值和方差;聚類模塊:用于聚類均值和方差得到聚類結果;分類模塊:根據聚類結果將篩選文本及其對應的語音數據分類得到k個語料庫。
在一些實施例中,上述裝置中切分模塊切分語音數據得到分割語料,包括:
通過語音活動檢測算法切分所述語音數據得到分割語料。
在一些實施例中,上述對比模塊還用于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳云知聲信息技術有限公司,未經深圳云知聲信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110616148.8/2.html,轉載請聲明來源鉆瓜專利網。





