[發(fā)明專利]用于移動(dòng)客戶端的文本播放方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202010000741.5 | 申請(qǐng)日: | 2020-01-02 |
| 公開(公告)號(hào): | CN111105779B | 公開(公告)日: | 2022-07-08 |
| 發(fā)明(設(shè)計(jì))人: | 胡帥君;李世龍;林喜;閆騰;李明輝 | 申請(qǐng)(專利權(quán))人: | 標(biāo)貝(北京)科技有限公司 |
| 主分類號(hào): | G10L13/047 | 分類號(hào): | G10L13/047 |
| 代理公司: | 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11481 | 代理人: | 徐丁峰;張瑋 |
| 地址: | 100192 北京市海淀區(qū)西小口路66號(hào)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 移動(dòng) 客戶端 文本 播放 方法 裝置 | ||
本發(fā)明實(shí)施例提供了用于移動(dòng)客戶端的文本播放方法、裝置、移動(dòng)客戶端和存儲(chǔ)介質(zhì),文本包括多個(gè)文本句,方法包括:播放根據(jù)服務(wù)器實(shí)時(shí)合成的第一合成語音確定的第一播放語音,第一合成語音與文本播放請(qǐng)求中的第一文本句對(duì)應(yīng);在開始播放第一播放語音的同時(shí),將第一文本句之后的下一個(gè)文本句發(fā)送至服務(wù)器,以供服務(wù)器實(shí)時(shí)合成與下一個(gè)文本句對(duì)應(yīng)的第二合成語音;接收服務(wù)器返回的第二合成語音;基于第二合成語音確定第二播放語音;將第二播放語音存儲(chǔ)到播放列表,其中播放列表用于按順序存儲(chǔ)播放語音;在播放完根據(jù)第一合成語音確定的所有播放語音的情況下,播放第二播放語音。上述方案實(shí)現(xiàn)了對(duì)篇幅較長(zhǎng)的文本進(jìn)行語音合成時(shí)的實(shí)時(shí)且不間斷播放。
技術(shù)領(lǐng)域
本發(fā)明涉及文語轉(zhuǎn)換(TTS)技術(shù)領(lǐng)域,更具體地涉及一種用于移動(dòng)客戶端的文本播放方法、裝置、移動(dòng)客戶端和存儲(chǔ)介質(zhì)。
背景技術(shù)
文語轉(zhuǎn)換技術(shù)是一種將文字信息轉(zhuǎn)化為聲音信息的技術(shù)。文語轉(zhuǎn)換技術(shù)可以為廣大用戶及第三方應(yīng)用提供語音合成服務(wù)。結(jié)合語音合成服務(wù),市場(chǎng)上逐漸涌現(xiàn)出一些落地的應(yīng)用場(chǎng)景,比如用戶用語音合成技術(shù)實(shí)現(xiàn)用自己的聲音給寶寶講故事,用自己的聲音導(dǎo)航等。
考慮到移動(dòng)客戶端在網(wǎng)絡(luò)連接、存儲(chǔ)資源等方面的局限性,現(xiàn)有的在移動(dòng)客戶端播放利用語音合成技術(shù)實(shí)時(shí)合成的語音的場(chǎng)景多是播放單句的情況,例如通過siri、小愛同學(xué)等智能語音助手進(jìn)行人機(jī)交互。上述人機(jī)交互通常是以問答的形式進(jìn)行的。智能語音助手每次接收到詢問之后,從數(shù)據(jù)庫查找對(duì)應(yīng)的文本句,并通過實(shí)時(shí)語音合成技術(shù)將查找到的文本句轉(zhuǎn)換為對(duì)應(yīng)的合成語音后播出。對(duì)于需要在移動(dòng)客戶端播放篇幅較長(zhǎng)的文本的情況,現(xiàn)有技術(shù)一般是通過語音合成技術(shù)獲取到與整個(gè)文本相對(duì)應(yīng)的合成語音,然后基于播放請(qǐng)求播放合成語音。
對(duì)于篇幅較長(zhǎng)的文本來說,如何在對(duì)其進(jìn)行語音合成的同時(shí)實(shí)時(shí)且不間斷地在移動(dòng)客戶端播放其語音,成為本領(lǐng)域技術(shù)人員亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
考慮到上述問題而提出了本發(fā)明。
根據(jù)本發(fā)明一個(gè)方面,提供了一種用于移動(dòng)客戶端的文本播放方法,所述文本包括多個(gè)文本句,所述方法包括:
S100:播放根據(jù)服務(wù)器實(shí)時(shí)合成的第一合成語音確定的第一播放語音,所述第一合成語音與文本播放請(qǐng)求中的第一文本句對(duì)應(yīng);
S200:在開始播放所述第一播放語音的同時(shí),將所述第一文本句之后的下一個(gè)文本句發(fā)送至所述服務(wù)器,以供所述服務(wù)器實(shí)時(shí)合成與所述下一個(gè)文本句對(duì)應(yīng)的第二合成語音;
S300:接收所述服務(wù)器返回的所述第二合成語音;
S400:基于所述第二合成語音確定第二播放語音;
S500:將所述第二播放語音存儲(chǔ)到播放列表,其中所述播放列表用于按順序存儲(chǔ)播放語音;
S600:在播放完根據(jù)所述第一合成語音確定的所有播放語音的情況下,播放所述第二播放語音。
示例性地,所述步驟S400包括:將所述第二合成語音轉(zhuǎn)換為具有固定時(shí)長(zhǎng)的一個(gè)或多個(gè)第二播放語音;
所述步驟S500包括:將所述一個(gè)或多個(gè)第二播放語音按順序存儲(chǔ)到所述播放列表的對(duì)應(yīng)位置中;
所述方法還包括:
根據(jù)當(dāng)前播放的第二播放語音在所述播放列表中的位置計(jì)算已播放時(shí)長(zhǎng);
根據(jù)當(dāng)前播放的第二播放語音在所述播放列表中的位置計(jì)算已播放時(shí)長(zhǎng);
確定所述文本的播放總時(shí)長(zhǎng);
基于所述已播放時(shí)長(zhǎng)和所述播放總時(shí)長(zhǎng)的比率,確定所述文本的播放進(jìn)度;
基于所述緩存時(shí)長(zhǎng)和所述播放總時(shí)長(zhǎng)的比率,確定所述文本的緩存進(jìn)度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于標(biāo)貝(北京)科技有限公司,未經(jīng)標(biāo)貝(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010000741.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L13-00 語音合成;文本-語音合成系統(tǒng)
G10L13-02 .產(chǎn)生合成語音的方法;語音合成設(shè)備
G10L13-06 .語音合成設(shè)備中使用的基本語音單位;級(jí)聯(lián)規(guī)則
G10L13-08 .文本分析或文本以外的語音合成參數(shù)的產(chǎn)生,例如語義圖翻譯為音素、韻律產(chǎn)生、重音或聲調(diào)測(cè)定
G10L13-04 ..語音合成系統(tǒng)的零部件,例如合成設(shè)備結(jié)構(gòu)或存儲(chǔ)器管理
- 移動(dòng)臺(tái),基站,移動(dòng)通信系統(tǒng),移動(dòng)通信與移動(dòng)通信程序
- 移動(dòng)通信系統(tǒng)、移動(dòng)終端以及移動(dòng)通信方法
- 移動(dòng)支付裝置、移動(dòng)終端POS以及移動(dòng)終端
- 移動(dòng)控制裝置、移動(dòng)體、移動(dòng)體系統(tǒng)、移動(dòng)控制方法及程序
- 移動(dòng)終端后蓋、移動(dòng)終端殼體及移動(dòng)終端
- 移動(dòng)平臺(tái)的輔助移動(dòng)方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 自移動(dòng)設(shè)備移動(dòng)方法及自移動(dòng)設(shè)備
- 移動(dòng)輪(支撐移動(dòng))
- 移動(dòng)房屋(移動(dòng)酒店)
- 移動(dòng)控制方法、移動(dòng)裝置及移動(dòng)平臺(tái)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





