[發(fā)明專利]語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110640245.0 | 申請日: | 2021-06-09 |
| 公開(公告)號: | CN113096637B | 公開(公告)日: | 2021-11-02 |
| 發(fā)明(設(shè)計)人: | 徐燦;葉旭文 | 申請(專利權(quán))人: | 北京世紀(jì)好未來教育科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/04 |
| 代理公司: | 北京合智同創(chuàng)知識產(chǎn)權(quán)代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 100086 北京市海淀區(qū)中*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 合成 方法 裝置 計算機(jī) 可讀 存儲 介質(zhì) | ||
本公開實施例提供一種語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì),語音合成方法包括:響應(yīng)于接收到的目標(biāo)文本,將目標(biāo)文本進(jìn)行切分處理,得到目標(biāo)文本對應(yīng)的至少兩個子文本;基于所述至少兩個子文本生成至少兩個合成子任務(wù),其中,每個合成子任務(wù)用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù),一個合成子任務(wù)對應(yīng)一個子文本;基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序,確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理優(yōu)先級;基于處理優(yōu)先級執(zhí)行合成子任務(wù),得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。本公開實施例用于語音合成。
技術(shù)領(lǐng)域
本公開實施例涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
語音合成技術(shù)可以將文字?jǐn)?shù)據(jù)轉(zhuǎn)換為音頻數(shù)據(jù)進(jìn)行播放,在許多技術(shù)有著廣泛應(yīng)用,例如,在線教育行業(yè),翻譯行業(yè)等。通常,可以利用語音合成模型對文字?jǐn)?shù)據(jù)進(jìn)行語音合成得到音頻數(shù)據(jù),但語音合成模型在速度上往往不能滿足實時性要求。
發(fā)明內(nèi)容
有鑒于此,本公開實施例提供一種語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì),用以改善因為合成模型的處理速度,導(dǎo)致語音合成實時性差的缺陷。
第一方面,本公開實施例提供了一種語音合成方法,其包括:響應(yīng)于接收到的目標(biāo)文本,將目標(biāo)文本進(jìn)行切分處理,得到目標(biāo)文本對應(yīng)的至少兩個子文本;基于至少兩個子文本生成至少兩個合成子任務(wù),其中,每個合成子任務(wù)用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù),一個合成子任務(wù)對應(yīng)一個子文本;基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序,確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理優(yōu)先級;基于處理優(yōu)先級執(zhí)行合成子任務(wù),得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。
第二方面,本公開實施例提供了一種語音合成裝置,其包括:切分模塊,配置為響應(yīng)于接收到的目標(biāo)文本,將目標(biāo)文本進(jìn)行切分處理,得到目標(biāo)文本對應(yīng)的至少兩個子文本;任務(wù)模塊,配置為基于至少兩個子文本并生成至少兩個合成子任務(wù),其中,每個合成子任務(wù)用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù),一個合成子任務(wù)對應(yīng)一個子文本;優(yōu)先級模塊,配置為基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序,確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理處理優(yōu)先級;語音合成模塊,配置為基于按照確定的處理處理優(yōu)先級執(zhí)行合成子任務(wù),得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。
第三方面,本公開實施例提供了一種電子設(shè)備,其包括:至少一個處理器和存儲器。存儲器存儲有至少一個程序,至少一個程序在被至少一個處理器執(zhí)行時,使得至少一個處理器實現(xiàn)根據(jù)本公開實施例的方法。
第四方面,本申請公開實施例提供了一種計算機(jī)可讀存儲介質(zhì),該計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)程序,計算機(jī)程序在被處理器執(zhí)行時,使所述處理器實現(xiàn)根據(jù)本公開如第一方面或第一方面的任意一些實施例所描述的語音合成方法。
本公開實施例提供的語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì),響應(yīng)于接收到的目標(biāo)文本,將目標(biāo)文本進(jìn)行切分處理,得到目標(biāo)文本對應(yīng)的至少兩個子文本;基于所 述至少兩個子文本生成至少兩個合成子任務(wù),其中,每個合成子任務(wù) 用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù),一個合成子任務(wù)對應(yīng)一個子文本;基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序,確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理優(yōu)先級;基于處理優(yōu)先級執(zhí)行合成子任務(wù),得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。因為將目標(biāo)文本切分為至少兩個子文本,并生成至少兩個合成子任務(wù),使得一個目標(biāo)文本可以按照合成子任務(wù)多次交付,只要完成一個合成子任務(wù),就可以輸出一段對應(yīng)的音頻數(shù)據(jù),提高了語音合成的實時性。
附圖說明
后文將參照附圖以示例性而非限制性的方式詳細(xì)描述本公開實施例的一些具體實施例。附圖中相同的附圖標(biāo)記標(biāo)示了相同或類似的部件或部分。本領(lǐng)域技術(shù)人員應(yīng)該理解,這些附圖未必是按比值繪制的。附圖中:
圖1為根據(jù)本公開實施例的一種語音合成方法的流程圖;
圖2為根據(jù)本公開實施例的一種切分效果示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京世紀(jì)好未來教育科技有限公司,未經(jīng)北京世紀(jì)好未來教育科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110640245.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





