[發明專利]語音合成方法及電子設備在審
| 申請號: | 202010921206.3 | 申請日: | 2020-09-04 |
| 公開(公告)號: | CN112016325A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 馮大航;陳孝良 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06N3/04;G06N3/08;G10L13/02;G10L25/30 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 黃燦;左曉菲 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 方法 電子設備 | ||
本發明提供一種語音合成方法及電子設備,所述方法包括:將待處理文本輸入文本特征提取模型,得到第一文本特征;將所述第一文本特征輸入用于分詞的第一條件隨機場CRF模型,得到分詞結果;將所述第一文本特征及所述分詞結果輸入用于詞性標注的第二CRF模型,得到詞性標注結果;基于所述詞性標注結果進行文本分析,得到文本分析結果;基于所述文本分析結果進行語音合成。本發明實施例能夠提高語音合成的效果。
技術領域
本發明涉及自然語言處理技術領域,尤其涉及一種語音合成方法及電子設備。
背景技術
語音合成,是一種能夠將文字信息轉化為語音并進行朗讀的技術。隨著科技的不斷進步,語音合成的應用越來越廣泛,如新聞與信息的播報、有聲小說等。在日常生活中,也可通過語音合成,將短信、郵件等信息合成為語音,為用戶多提供一種獲取信息的方式。
傳統的語音合成采用參數合成方法,通過共振峰合成器可以得到許多逼真的合成語音,然而,由于準確提取共振峰參數較為困難,導致參數合成方法合成語音的效果較差。
發明內容
本發明實施例提供一種語音合成方法及電子設備,以解決傳統的語音合成效果較差的問題。
為了解決上述技術問題,本發明是這樣實現的:
第一方面,本發明實施例提供了一種語音合成方法,所述方法包括:
將待處理文本輸入文本特征提取模型,得到第一文本特征;
將所述第一文本特征輸入用于分詞的第一條件隨機場CRF模型,得到分詞結果;
將所述第一文本特征及所述分詞結果輸入用于詞性標注的第二CRF模型,得到詞性標注結果;
基于所述詞性標注結果進行文本分析,得到文本分析結果;
基于所述文本分析結果進行語音合成。
第二方面,本發明實施例提供了一種電子設備,所述電子設備包括:
第一輸入模塊,用于將待處理文本輸入文本特征提取模型,得到第一文本特征;
第二輸入模塊,用于將所述第一文本特征輸入用于分詞的第一條件隨機場CRF模型,得到分詞結果;
第三輸入模塊,用于將所述第一文本特征及所述分詞結果輸入用于詞性標注的第二CRF模型,得到詞性標注結果;
分析模塊,用于基于所述詞性標注結果進行文本分析,得到文本分析結果;
合成模塊,用于基于所述文本分析結果進行語音合成。
第三方面,本發明實施例提供了一種電子設備,包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現如第一方面所述的語音合成方法的步驟。
第四方面,本發明實施例提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如第一方面所述的語音合成方法的步驟。
本發明實施例中,將待處理文本輸入文本特征提取模型,得到第一文本特征;將所述第一文本特征輸入用于分詞的第一條件隨機場CRF模型,得到分詞結果;將所述第一文本特征及所述分詞結果輸入用于詞性標注的第二CRF模型,得到詞性標注結果;基于所述詞性標注結果進行文本分析,得到文本分析結果;基于所述文本分析結果進行語音合成。這樣,通過文本特征提取模型、第一條件隨機場CRF模型及第二CRF模型獲取詞性標注結果進行文本分析,文本分析的效果較好,且在進行詞性標注的過程中采用了分詞過程中的中間變量第一文本特征,能夠提高詞性標注的準確率,從而能夠提高語音合成的效果。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010921206.3/2.html,轉載請聲明來源鉆瓜專利網。





