[發明專利]用于確定音素發音時長的方法和裝置有效
| 申請號: | 201710911991.2 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107705782B | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 張黃斌 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/10;G06F40/205;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 確定 音素 發音 方法 裝置 | ||
本申請實施例公開了用于確定音素發音時長的方法和裝置。該方法的一具體實施方式包括:獲取待合成語音對應的文本;提取該文本的文本特征;將該文本特征導入預先建立的第一時長確定模型,生成發音時長類型序列,其中,該發音時長類型序列中的發音時長類型與該文本對應的音素序列中的音素對應,該第一時長確定模型用于表征文本特征與發音時長類型序列之間的對應關系;根據所生成的發音時長類型序列和預先設置的對應關系信息,確定該文本對應的音素序列中各個音素的發音時長,其中,該對應關系信息用于指示發音時長類型與發音時長的之間的對應關系。該實施方式提高了所確定的音素的發音時長準確性。
技術領域
本申請實施例涉及計算機技術領域,具體涉及語音合成技術領域,尤其涉及用于確定音素發音時長的方法和裝置。
背景技術
語音合成技術,又稱文語轉換技術,是通過機械的、電子的方法產生人造語音的技術。它是將計算機本地產生的或外部輸入的文字信息轉變為可以被人聽得懂的、流利的語音的技術。在語音合成的過程中,需要對拼接多個語音單元對應的音頻,語音單元可以是拼音,也可以是音素。
然而,現有的語音合成的方法,通常是對語音單元的發音時長不做區分。
發明內容
本申請實施例的目的在于提出一種用于確定音素發音時長的方法和裝置。
第一方面,本申請實施例提供了一種用于確定音素發音時長的方法,上述方法包括:獲取待合成語音對應的文本;提取上述文本的文本特征;將上述文本特征導入預先建立的第一時長確定模型,生成發音時長類型序列,其中,上述發音時長類型序列中的發音時長類型與上述文本對應的音素序列中的音素對應,上述第一時長確定模型用于表征文本特征與發音時長類型序列之間的對應關系;根據所生成的發音時長類型序列和預先設置的對應關系信息,確定上述文本對應的音素序列中各個音素的發音時長,其中,上述對應關系信息用于指示發音時長類型與發音時長的之間的對應關系。
第二方面,本申請實施例提供了一種用于確定音素發音時長的裝置,上述裝置包括:獲取單元,用于獲取待合成語音對應的文本;提取單元,用于提取上述文本的文本特征;第一生成單元,用于將上述文本特征導入預先建立的第一時長確定模型,生成發音時長類型序列,其中,上述發音時長類型序列中的發音時長類型與上述文本對應的音素序列中的音素對應,上述第一時長確定模型用于表征文本特征與發音時長類型序列之間的對應關系;確定單元,用于根據所生成的發音時長類型序列和預先設置的對應關系信息,確定上述文本對應的音素序列中各個音素的發音時長,其中,上述對應關系信息用于指示發音時長類型與發音時長的之間的對應關系。
第三方面,本申請實施例提供了一種電子設備,上述電子設備包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當上述一個或多個程序被上述一個或多個處理器執行時,使得上述一個或多個處理器實現如第一方面的方法。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如第一方面的方法。
本申請實施例提供的用于確定音素發音時長的方法和裝置,通過首先提取待合成語音對應的文本的文本特征,然后利用第一時長確定模型確定發音時長類型序列,再根據用于指示發音時長類型與發音時長的之間的對應關系的對應關系信息,得到上述文本對應的音素序列中各個音素的發音時長,由此,可以確定更為準確的音素發音時長。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
圖1是本申請可以應用于其中的示例性系統架構圖;
圖2是根據本申請的用于確定音素發音時長的方法的一個實施例的流程圖;
圖3是根據本申請的用于確定音素發音時長的方法的一個應用場景的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710911991.2/2.html,轉載請聲明來源鉆瓜專利網。





