[發(fā)明專利]語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)有效

申請?zhí)枺?/td>	202110640245.0	申請日：	2021-06-09
公開（公告）號：	CN113096637B	公開（公告）日：	2021-11-02
發(fā)明（設(shè)計）人：	徐燦;葉旭文	申請（專利權(quán)）人：	北京世紀(jì)好未來教育科技有限公司
主分類號：	G10L13/02	分類號：	G10L13/02;G10L13/04
代理公司：	北京合智同創(chuàng)知識產(chǎn)權(quán)代理有限公司 11545	代理人：	李杰
地址：	100086 北京市海淀區(qū)中***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音合成方法裝置計算機(jī) 可讀存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本公開實施例提供一種語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)，語音合成方法包括：響應(yīng)于接收到的目標(biāo)文本，將目標(biāo)文本進(jìn)行切分處理，得到目標(biāo)文本對應(yīng)的至少兩個子文本；基于所述至少兩個子文本生成至少兩個合成子任務(wù)，其中，每個合成子任務(wù)用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù)，一個合成子任務(wù)對應(yīng)一個子文本；基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序，確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理優(yōu)先級；基于處理優(yōu)先級執(zhí)行合成子任務(wù)，得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。本公開實施例用于語音合成。

技術(shù)領(lǐng)域

本公開實施例涉及計算機(jī)技術(shù)領(lǐng)域，尤其涉及一種語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)。

背景技術(shù)

語音合成技術(shù)可以將文字?jǐn)?shù)據(jù)轉(zhuǎn)換為音頻數(shù)據(jù)進(jìn)行播放，在許多技術(shù)有著廣泛應(yīng)用，例如，在線教育行業(yè)，翻譯行業(yè)等。通常，可以利用語音合成模型對文字?jǐn)?shù)據(jù)進(jìn)行語音合成得到音頻數(shù)據(jù)，但語音合成模型在速度上往往不能滿足實時性要求。

發(fā)明內(nèi)容

有鑒于此，本公開實施例提供一種語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)，用以改善因為合成模型的處理速度，導(dǎo)致語音合成實時性差的缺陷。

第一方面，本公開實施例提供了一種語音合成方法，其包括：響應(yīng)于接收到的目標(biāo)文本，將目標(biāo)文本進(jìn)行切分處理，得到目標(biāo)文本對應(yīng)的至少兩個子文本；基于至少兩個子文本生成至少兩個合成子任務(wù)，其中，每個合成子任務(wù)用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù)，一個合成子任務(wù)對應(yīng)一個子文本；基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序，確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理優(yōu)先級；基于處理優(yōu)先級執(zhí)行合成子任務(wù)，得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。

第二方面，本公開實施例提供了一種語音合成裝置，其包括：切分模塊，配置為響應(yīng)于接收到的目標(biāo)文本，將目標(biāo)文本進(jìn)行切分處理，得到目標(biāo)文本對應(yīng)的至少兩個子文本；任務(wù)模塊，配置為基于至少兩個子文本并生成至少兩個合成子任務(wù)，其中，每個合成子任務(wù)用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù)，一個合成子任務(wù)對應(yīng)一個子文本；優(yōu)先級模塊，配置為基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序，確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理處理優(yōu)先級；語音合成模塊，配置為基于按照確定的處理處理優(yōu)先級執(zhí)行合成子任務(wù)，得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。

第三方面，本公開實施例提供了一種電子設(shè)備，其包括：至少一個處理器和存儲器。存儲器存儲有至少一個程序，至少一個程序在被至少一個處理器執(zhí)行時，使得至少一個處理器實現(xiàn)根據(jù)本公開實施例的方法。

第四方面，本申請公開實施例提供了一種計算機(jī)可讀存儲介質(zhì)，該計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)程序，計算機(jī)程序在被處理器執(zhí)行時，使所述處理器實現(xiàn)根據(jù)本公開如第一方面或第一方面的任意一些實施例所描述的語音合成方法。

本公開實施例提供的語音合成方法、裝置及計算機(jī)可讀存儲介質(zhì)，響應(yīng)于接收到的目標(biāo)文本，將目標(biāo)文本進(jìn)行切分處理，得到目標(biāo)文本對應(yīng)的至少兩個子文本；基于所述至少兩個子文本生成至少兩個合成子任務(wù)，其中，每個合成子任務(wù) 用于指示將對應(yīng)的子文本進(jìn)行語音合成得到對應(yīng)的音頻數(shù)據(jù)，一個合成子任務(wù)對應(yīng)一個子文本；基于目標(biāo)文本的請求時間以及子文本在目標(biāo)文本中的順序，確定至少兩個合成子任務(wù)中每個合成子任務(wù)的處理優(yōu)先級；基于處理優(yōu)先級執(zhí)行合成子任務(wù)，得到合成子任務(wù)對應(yīng)的音頻數(shù)據(jù)。因為將目標(biāo)文本切分為至少兩個子文本，并生成至少兩個合成子任務(wù)，使得一個目標(biāo)文本可以按照合成子任務(wù)多次交付，只要完成一個合成子任務(wù)，就可以輸出一段對應(yīng)的音頻數(shù)據(jù)，提高了語音合成的實時性。

附圖說明

后文將參照附圖以示例性而非限制性的方式詳細(xì)描述本公開實施例的一些具體實施例。附圖中相同的附圖標(biāo)記標(biāo)示了相同或類似的部件或部分。本領(lǐng)域技術(shù)人員應(yīng)該理解，這些附圖未必是按比值繪制的。附圖中：

圖1為根據(jù)本公開實施例的一種語音合成方法的流程圖；

圖2為根據(jù)本公開實施例的一種切分效果示意圖；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京世紀(jì)好未來教育科技有限公司，未經(jīng)北京世紀(jì)好未來教育科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110640245.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：異常行為樣本生成方法及系統(tǒng)
下一篇：一種軌道綜合檢測系統(tǒng)

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L13-00 語音合成；文本-語音合成系統(tǒng)
G10L13-02 .產(chǎn)生合成語音的方法；語音合成設(shè)備
G10L13-06 .語音合成設(shè)備中使用的基本語音單位；級聯(lián)規(guī)則
G10L13-08 .文本分析或文本以外的語音合成參數(shù)的產(chǎn)生，例如語義圖翻譯為音素、韻律產(chǎn)生、重音或聲調(diào)測定
G10L13-04 ..語音合成系統(tǒng)的零部件，例如合成設(shè)備結(jié)構(gòu)或存儲器管理

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】