[發(fā)明專利]一種語音合成方法和裝置有效
| 申請?zhí)枺?/td> | 201710061669.5 | 申請日: | 2017-01-26 |
| 公開(公告)號: | CN108364631B | 公開(公告)日: | 2021-01-22 |
| 發(fā)明(設計)人: | 孟凡博 | 申請(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/10;G10L15/14 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 郭化雨;王寶筠 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 合成 方法 裝置 | ||
1.一種語音合成方法,其特征在于,所述方法包括:
獲取語音合成請求,所述語音合成請求攜帶待合成語音的語言片段,所述語言片段包括至少一個語義單元;
根據(jù)所述至少一個語義單元,通過統(tǒng)計模型確定出對應的中性語音聲學參數(shù),所述統(tǒng)計模型為根據(jù)中性語音聲學參數(shù)建立的、用于合成語音的模型;
根據(jù)特定語氣的語氣特點,對確定出的中性語音聲學參數(shù)進行處理,并合成出所述語言片段對應的特定語氣片段,所述特定語氣片段為具有所述語氣特點的語音片段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音合成請求為針對所述特定語氣的語音合成請求,所述語音合成請求中攜帶所述特定語氣的標識,所述根據(jù)特定語氣的語氣特點,對確定出的中性語音聲學參數(shù)進行處理,包括:
根據(jù)所述標識查找出對應所述特定語氣的語氣特點;
根據(jù)所述語氣特點對確定出的中性語音聲學參數(shù)進行處理。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述語氣特點包括所述特定語氣的時長范圍和/或重音位置,所述根據(jù)特定語氣的語氣特點,對確定出的中性語音聲學參數(shù)進行處理,包括:
將所述確定出的中性語音聲學參數(shù)的時長參數(shù)調(diào)整到所述時長范圍內(nèi);和/或
根據(jù)所述重音位置,將所述確定出的中性語音聲學參數(shù)中對應所述重音位置的中性語音聲學參數(shù)進行重音處理。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,當所述根據(jù)特定語氣的語氣特點,對確定出的中性語音聲學參數(shù)進行處理包括根據(jù)所述重音位置,將所述確定出的中性語音聲學參數(shù)中對應所述重音位置的中性語音聲學參數(shù)進行重音處理時,所述根據(jù)所述重音位置,將所述確定出的中性語音聲學參數(shù)中對應所述重音位置的中性語音聲學參數(shù)進行重音處理,包括以下三種處理方式中任意一種或多種的組合:
提高對應所述重音位置的時長參數(shù);
調(diào)整對應所述重音位置的基頻參數(shù);
提高對應所述重音位置的頻譜參數(shù)的能量維。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括:
確定對應所述重音位置的聲調(diào);
所述提高對應所述重音位置的時長參數(shù),包括:
根據(jù)所述聲調(diào)將所述對應所述重音位置的時長參數(shù)提高對應的比例;
所述調(diào)整對應所述重音位置的基頻參數(shù),包括:
根據(jù)所述聲調(diào)將對應所述重音位置的基頻參數(shù)調(diào)整對應的比例。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,當所述根據(jù)特定語氣的語氣特點,對確定出的中性語音聲學參數(shù)進行處理包括根據(jù)所述重音位置,將所述確定出的中性語音聲學參數(shù)中對應所述重音位置的中性語音聲學參數(shù)進行重音處理時,在所述根據(jù)所述重音位置,將所述確定出的中性語音聲學參數(shù)中對應所述重音位置的中性語音聲學參數(shù)進行重音處理之前,還包括:
判斷所述語言片段對應所述重音位置的詞語是否為輕聲詞;
若是,則不對所述確定出的中性語音聲學參數(shù)中對應所述重音位置的中性語音聲學參數(shù)進行重音處理。
7.一種語音合成裝置,其特征在于,所述裝置包括獲取單元、確定單元和合成單元:
所述獲取單元,用于獲取語音合成請求,所述語音合成請求攜帶待合成語音的語言片段,所述語言片段包括至少一個語義單元;
所述確定單元,用于根據(jù)所述至少一個語義單元,通過統(tǒng)計模型確定出對應的中性語音聲學參數(shù),所述統(tǒng)計模型為根據(jù)中性語音聲學參數(shù)建立的、用于合成語音的模型;
所述合成單元,用于根據(jù)特定語氣的語氣特點,對確定出的中性語音聲學參數(shù)進行處理,并合成出所述語言片段對應的特定語氣片段,所述特定語氣片段為具有所述語氣特點的語音片段。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語音合成請求為針對所述特定語氣的語音合成請求,所述語音合成請求中攜帶所述特定語氣的標識,所述確定單元還用于根據(jù)所述標識查找出對應所述特定語氣的語氣特點;根據(jù)所述語氣特點對確定出的中性語音聲學參數(shù)進行處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710061669.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:防塵導電觸控體
- 下一篇:一種具備情感的中文文本人聲合成方法





