[發(fā)明專利]語音合成系統(tǒng)的優(yōu)化方法和裝置有效
| 申請?zhí)枺?/td> | 201610034930.8 | 申請日: | 2016-01-19 |
| 公開(公告)號: | CN105489216B | 公開(公告)日: | 2020-03-03 |
| 發(fā)明(設(shè)計)人: | 郝慶暢;李秀林;白潔;唐海員 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;H04L12/721 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 合成 系統(tǒng) 優(yōu)化 方法 裝置 | ||
本發(fā)明公開了一種語音合成系統(tǒng)的優(yōu)化方法和裝置,其中,語音合成系統(tǒng)的優(yōu)化方法包括:接收包含文本信息的語音合成請求;確定在接收到語音合成請求時語音合成系統(tǒng)的負載等級;以及選擇與負載等級對應(yīng)的語音合成路徑,并根據(jù)語音合成路徑對文本信息進行語音合成。本發(fā)明實施例的語音合成系統(tǒng)的優(yōu)化方法和裝置,通過接收包含文本信息的語音合成請求,并確定在接收到語音合成請求時語音合成系統(tǒng)的負載等級,以及選擇與負載等級對應(yīng)的語音合成路徑,并根據(jù)語音合成路徑對文本信息進行語音合成,能夠根據(jù)語音合成系統(tǒng)的負載等級彈性地選擇相應(yīng)的語音合成路徑,從而實現(xiàn)語音合成,為用戶提供更加穩(wěn)定的服務(wù),避免延時情況的發(fā)生,提升用戶使用體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及語音合成技術(shù)領(lǐng)域,尤其涉及一種語音合成系統(tǒng)的優(yōu)化方法和裝置。
背景技術(shù)
隨著移動互聯(lián)網(wǎng)和人工智能技術(shù)的快速發(fā)展,語音播報、聽小說、聽新聞、智能交互等一系列語音合成的場景越來越多。
目前,語音合成系統(tǒng)在對文本進行語音合成時,首先對輸入的文本進行歸一化預(yù)處理,然后對文本進行分詞、詞性標(biāo)注、注音等操作,再對文本進行韻律等級的預(yù)測,以及預(yù)測聲學(xué)參數(shù),最后輸出最終的語音結(jié)果。
但是,語音合成系統(tǒng)的配置一般都是固定的,無法根據(jù)實際場景及負載情況進行彈性的設(shè)置,無法適應(yīng)不同環(huán)境下的語音合成需求。例如:當(dāng)語音合成系統(tǒng)短時間內(nèi)接收到大量的語音合成請求時,很有可能超出語音合成系統(tǒng)的負載能力,會造成語音合成請求的堆積,導(dǎo)致用戶收到反饋結(jié)果延時,從而影響用戶使用體驗。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本發(fā)明的一個目的在于提出一種語音合成系統(tǒng)的優(yōu)化方法,能夠根據(jù)語音合成系統(tǒng)的負載等級彈性地選擇相應(yīng)的語音合成路徑,為用戶提供更加穩(wěn)定的服務(wù),避免延時情況的發(fā)生,提升用戶使用體驗。
本發(fā)明的第二個目的在于提出一種語音合成系統(tǒng)的優(yōu)化裝置。
為了實現(xiàn)上述目的,本發(fā)明第一方面實施例提出了一種語音合成系統(tǒng)的優(yōu)化方法,包括:接收包含文本信息的語音合成請求;確定在接收到所述語音合成請求時語音合成系統(tǒng)的負載等級;以及選擇與所述負載等級對應(yīng)的語音合成路徑,并根據(jù)所述語音合成路徑對所述文本信息進行語音合成。
本發(fā)明實施例的語音合成系統(tǒng)的優(yōu)化方法,通過接收包含文本信息的語音合成請求,并確定在接收到語音合成請求時語音合成系統(tǒng)的負載等級,以及選擇與負載等級對應(yīng)的語音合成路徑,并根據(jù)語音合成路徑對文本信息進行語音合成,能夠根據(jù)語音合成系統(tǒng)的負載等級彈性地選擇相應(yīng)的語音合成路徑,從而實現(xiàn)語音合成,為用戶提供更加穩(wěn)定的服務(wù),避免延時情況的發(fā)生,提升用戶使用體驗。
本發(fā)明第二方面實施例提出了一種語音合成系統(tǒng)的優(yōu)化裝置,包括:接收模塊,用于接收包含文本信息的語音合成請求;確定模塊,用于確定在接收到所述語音合成請求時語音合成系統(tǒng)的負載等級;以及合成模塊,用于選擇與所述負載等級對應(yīng)的語音合成路徑,并根據(jù)所述語音合成路徑對所述文本信息進行語音合成。
本發(fā)明實施例的語音合成系統(tǒng)的優(yōu)化裝置,通過接收包含文本信息的語音合成請求,并確定在接收到語音合成請求時語音合成系統(tǒng)的負載等級,以及選擇與負載等級對應(yīng)的語音合成路徑,并根據(jù)語音合成路徑對文本信息進行語音合成,能夠根據(jù)語音合成系統(tǒng)的負載等級彈性地選擇相應(yīng)的語音合成路徑,從而實現(xiàn)語音合成,為用戶提供更加穩(wěn)定的服務(wù),避免延時情況的發(fā)生,提升用戶使用體驗。
附圖說明
圖1是根據(jù)本發(fā)明一個實施例的語音合成系統(tǒng)的優(yōu)化方法的流程圖;
圖2是根據(jù)本發(fā)明一個具體實施例的語音合成系統(tǒng)的優(yōu)化方法的流程圖;
圖3是根據(jù)本發(fā)明一個具體實施例的語音合成系統(tǒng)的框架結(jié)構(gòu)示意圖;
圖4是根據(jù)本發(fā)明一個實施例的語音合成系統(tǒng)的優(yōu)化裝置的結(jié)構(gòu)示意圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610034930.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





