[發(fā)明專利]一種語音播報方法、裝置、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202110352361.2 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113066474A | 公開(公告)日: | 2021-07-02 |
| 發(fā)明(設(shè)計)人: | 劉浩 | 申請(專利權(quán))人: | 北京獵戶星空科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/08 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 杜晶 |
| 地址: | 100025 北京市朝*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 播報 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種語音播報方法,其特征在于,應(yīng)用于智能設(shè)備,所述方法包括:
若所述智能設(shè)備與從文本到語音TTS服務(wù)器的網(wǎng)絡(luò)連通,將已配置的第一文本信息及表征所述智能設(shè)備語音播報的屬性信息的至少一個屬性值組發(fā)送給所述TTS服務(wù)器;
接收并保存所述TTS服務(wù)器返回的音頻文件,其中,所述音頻文件是所述TTS服務(wù)器根據(jù)所述第一文本信息和所述屬性值組進(jìn)行語音合成得到的;
若確定需要進(jìn)行語音播報,則在已保存的音頻文件中查找對應(yīng)的目標(biāo)音頻文件,并控制所述智能設(shè)備播放所述目標(biāo)音頻文件。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
若在將所述第一文本信息及所述至少一個屬性值組發(fā)送給所述TTS服務(wù)器之后,網(wǎng)絡(luò)中斷,則監(jiān)測網(wǎng)絡(luò)狀態(tài);
若監(jiān)測到網(wǎng)絡(luò)連通,根據(jù)已保存的音頻文件,確定未合成的數(shù)據(jù)信息,所述數(shù)據(jù)信息包括第一文本信息中未合成音頻文件的第二文本信息、和/或第一文本信息中未合成音頻文件的第一目標(biāo)屬性值組;
將所述數(shù)據(jù)信息的相關(guān)信息發(fā)送給所述TTS服務(wù)器,以使所述TTS服務(wù)器根據(jù)所述數(shù)據(jù)信息合成音頻文件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
接收到針對所述第一文本信息的更新請求,確定更新后的第一文本信息;
若已保存的音頻文件中未包含更新后的第一文本信息對應(yīng)的音頻文件,則將所述更新后的第一文本信息以及所述更新后的第一文本信息的屬性值組發(fā)送給所述TTS服務(wù)器;
接收所述TTS服務(wù)器根據(jù)所述更新后的第一文本信息以及所述更新后的第一文本信息的屬性值組合成的音頻文件并保存。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
接收到針對屬性信息的屬性值的切換請求,確定切換后的第二目標(biāo)屬性值組;
若已保存的音頻文件未包含所述第二目標(biāo)屬性值組對應(yīng)的音頻文件,則將所述第一文本信息以及所述第二目標(biāo)屬性值組發(fā)送給所述TTS服務(wù)器;
接收所述TTS服務(wù)器根據(jù)所述第二目標(biāo)屬性值組以及所述第一文本信息合成的音頻文件并保存。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
若滿足第一更新條件,獲取已保存的各音頻文件被使用的頻次,將被使用頻次低于設(shè)定閾值的音頻文件刪除;和/或,
若滿足第二更新條件,確定所述智能設(shè)備當(dāng)前使用的第三目標(biāo)屬性值組,將除所述第三目標(biāo)屬性值組之外的屬性值組對應(yīng)的音頻文件刪除。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,其特征在于,所述屬性信息包括以下至少一種:
發(fā)音人角色、語言、TTS合成音量、語速以及音頻采樣率。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將已配置的第一文本信息及表征所述智能設(shè)備語音播報的屬性信息的至少一個屬性值組發(fā)送給所述TTS服務(wù)器,包括:
確定所述智能設(shè)備當(dāng)前使用的第三目標(biāo)屬性值組,將已配置的第一文本信息及所述第三目標(biāo)屬性值組發(fā)送給所述TTS服務(wù)器;或者
根據(jù)每個所述屬性信息的各屬性值,確定所述智能設(shè)備能夠配置的多個屬性值組,將已配置的第一文本信息及所述多個屬性值組發(fā)送給所述TTS服務(wù)器。
8.一種語音播報裝置,其特征在于,應(yīng)用于智能設(shè)備,所述裝置包括:
發(fā)送模塊,用于若所述智能設(shè)備與從文本到語音TTS服務(wù)器的網(wǎng)絡(luò)連通,將已配置的第一文本信息及表征所述智能設(shè)備語音播報的屬性信息的至少一個屬性值組發(fā)送給所述TTS服務(wù)器;
接收模塊,用于接收并保存所述TTS服務(wù)器返回的音頻文件,其中,所述音頻文件是所述TTS服務(wù)器根據(jù)所述第一文本信息和所述屬性值組進(jìn)行語音合成得到的;
處理模塊,用于若確定需要進(jìn)行語音播報,則在已保存的音頻文件中查找對應(yīng)的目標(biāo)音頻文件,并控制所述智能設(shè)備播放所述目標(biāo)音頻文件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京獵戶星空科技有限公司,未經(jīng)北京獵戶星空科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110352361.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





