[發(fā)明專利]語音合成方法及裝置在審
| 申請?zhí)枺?/td> | 202011266074.1 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112420017A | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計)人: | 滿達 | 申請(專利權(quán))人: | 北京沃東天駿信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 趙婷 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)濟*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 合成 方法 裝置 | ||
1.一種語音合成方法,應(yīng)用于語音合成引擎,包括:
接收來自用戶終端的語音服務(wù)請求;
確定與所述語音服務(wù)請求關(guān)聯(lián)的待處理語料;
確定針對所述待處理語料的文本特征,所述文本特征包括音素序列和音律特征;
基于所述文本特征,確定針對所述待處理語料的聲學特征;
基于所述文本特征和所述聲學特征,進行針對所述待處理語料的語音合成;
將語音合成結(jié)果返回所述用戶終端。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述接收來自用戶終端的語音服務(wù)請求,包括:
通過預設(shè)通信鏈路接收所述語音服務(wù)請求,所述預設(shè)通信鏈路支持離線數(shù)據(jù)傳輸。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述確定針對所述待處理語料的文本特征,包括:
獲得針對所述待處理語料的分詞序列;
確定與所述分詞序列關(guān)聯(lián)的音素序列;
利用預設(shè)的音律結(jié)構(gòu)模型,確定所述音素序列中的各音素的發(fā)音時長,以得到所述音律特征。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述利用預設(shè)的音律結(jié)構(gòu)模型,確定所述音素序列中的各音素的發(fā)音時長,以得到所述音律特征,包括:
將所述音素序列輸入所述音律結(jié)構(gòu)模型,確定與所述音素序列關(guān)聯(lián)的至少一個音律結(jié)構(gòu),其中,所述音律結(jié)構(gòu)包括音律詞結(jié)構(gòu)、音律短語結(jié)構(gòu)和語義短語結(jié)構(gòu)中的至少之一;
根據(jù)音律結(jié)構(gòu)與停頓時長的預設(shè)關(guān)聯(lián)關(guān)系,確定針對各所述音律結(jié)構(gòu)的停頓時長;
根據(jù)針對各所述音律結(jié)構(gòu)的停頓時長,確定所述音素序列中的各音素的發(fā)音時長,以得到所述音律特征。
5.根據(jù)權(quán)利要求3所述的方法,其中,所述基于所述文本特征,確定針對所述待處理語料的聲學特征,包括:
根據(jù)所述音律特征指示的各音素的發(fā)音時長,將所述各音素轉(zhuǎn)換為幀序列單元;
利用預設(shè)的聲學特征模型,確定與各所述幀序列單元關(guān)聯(lián)的聲學特征,以得到針對所述待處理語料的聲學特征。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述聲學特征模型包括:
基于通用樣本數(shù)據(jù)訓練得到的基礎(chǔ)聲學模型,和/或利用個性化樣本數(shù)據(jù)對所述基礎(chǔ)聲學模型訓練得到的個性化聲學模型,
其中,所述通用樣本數(shù)據(jù)包括至少一個用戶的語音和/或語料樣本,所述個性化樣本數(shù)據(jù)包括預設(shè)用戶的語音和/或語料樣本。
7.根據(jù)權(quán)利要求5所述的方法,其中,所述聲學特征包括譜特征、基頻特征、能量特征和非周期特征中的至少之一。
8.一種語音合成裝置,包括:
接收模塊,用于接收來自用戶終端的語音服務(wù)請求;
第一處理模塊,用于確定與所述語音服務(wù)請求關(guān)聯(lián)的待處理語料;
第二處理模塊,用于確定針對所述待處理語料的文本特征,所述文本特征包括音素序列和音律特征;
第三處理模塊,用于基于所述文本特征,確定針對所述待處理語料的聲學特征;
第四處理模塊,用于基于所述文本特征和所述聲學特征,進行針對所述待處理語料的語音合成;
發(fā)送模塊,用于將語音合成結(jié)果返回所述用戶終端。
9.一種電子設(shè)備,包括:
一個或多個處理器;以及
存儲器,用于存儲一個或多個程序,
其中,當所述一個或多個程序被所述一個或多個處理器執(zhí)行時,使得所述一個或多個處理器實現(xiàn)權(quán)利要求1至7中任一項所述的方法。
10.一種計算機可讀存儲介質(zhì),其上存儲有可執(zhí)行指令,該指令被處理器執(zhí)行時使處理器實現(xiàn)權(quán)利要求1至7中任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京沃東天駿信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京沃東天駿信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011266074.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





