[發(fā)明專利]一種模擬發(fā)聲方法及模擬發(fā)聲系統(tǒng)有效
| 申請?zhí)枺?/td> | 201711079101.2 | 申請日: | 2017-11-06 |
| 公開(公告)號: | CN108109610B | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設(shè)計)人: | 孟猛 | 申請(專利權(quán))人: | 芋頭科技(杭州)有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/033;G10L13/04;G10L25/75;G10L25/93 |
| 代理公司: | 北京中原華和知識產(chǎn)權(quán)代理有限責(zé)任公司 11019 | 代理人: | 壽寧 |
| 地址: | 310000 浙江省杭州市余杭區(qū)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 模擬 發(fā)聲 方法 系統(tǒng) | ||
本發(fā)明公開了一種模擬發(fā)聲方法及模擬發(fā)聲系統(tǒng),屬于語音合成技術(shù)領(lǐng)域;方法包括獲取一待發(fā)聲文本;將待發(fā)聲文本中的文字分別轉(zhuǎn)化成對應(yīng)的基本音子,以形成包括依序排列的多個基本音子的音子序列;于音子序列中區(qū)分出隸屬于中文音標(biāo)的基本音子以及隸屬于英文音標(biāo)的基本音子;根據(jù)對應(yīng)關(guān)系將音子序列中隸屬于中文音標(biāo)的基本音子轉(zhuǎn)換成對應(yīng)的隸屬于英文音標(biāo)的基本音子,以形成一僅包括隸屬于英文音標(biāo)的基本音子的待發(fā)聲序列;將待發(fā)聲序列送入語音合成引擎中,以合成對應(yīng)于待發(fā)聲文本的一段語音并輸出。上述技術(shù)方案的有益效果是:采用一個語音合成引擎實現(xiàn)中英文混合語音的模擬發(fā)聲,降低模擬發(fā)聲處理的復(fù)雜度,保證模擬發(fā)聲的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及語音合成技術(shù)領(lǐng)域,尤其涉及一種模擬發(fā)聲方法及模擬發(fā)聲系統(tǒng)。
背景技術(shù)
隨著計算機技術(shù)的飛速發(fā)展以及語音識別技術(shù)的日漸成熟,語音合成技術(shù)也得到了巨大的發(fā)展和進步。語音合成技術(shù)能夠廣泛應(yīng)用到人們的日常生活中,出現(xiàn)了很多例如有聲小說、有聲新聞、天氣播報以及字典朗讀等的語音合成并模擬發(fā)聲的應(yīng)用,給人們的日常生活帶來了很多便利和娛樂樂趣。
現(xiàn)有的語音合成技術(shù)在可懂度和區(qū)分度上都能夠滿足日常應(yīng)用的需求,但是目前的語音合成技術(shù)通常只針對一種語音進行,例如僅針對中文或者僅針對英文。少部分同時支持中英文雙語的語音合成引擎通常的做法是:對兩個音色相近的中文/英文說話人,或者同一個中英文發(fā)音都很流利的說話人進行語音采樣,并分別建立中文/英文語音合成模型,在語音合成的時候針對中文/英文分別套用兩套語音合成模型分別進行語音合成,最后再將中文/英文的合成結(jié)果進行組合并得到最終的語音合成結(jié)果。
但是現(xiàn)有技術(shù)中,對于面向英美用戶的英文語音合成引擎(Text To Speech,TTS),一般很難找到音色合適又能流利說中文的英語母語的說話人,也較難找到音色與英文母語的說話人音色近似的中文說話人。因此,專用的英文語音合成引擎對于模擬中文發(fā)音的語音合成通常無能為力。
發(fā)明內(nèi)容
根據(jù)現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種模擬發(fā)聲方法及模擬發(fā)聲系統(tǒng)的技術(shù)方案,旨在采用一個語音合成引擎就能較好地實現(xiàn)中英文混合語音的模擬發(fā)聲處理,降低了模擬發(fā)聲處理的復(fù)雜度,并且保證模擬發(fā)聲的準(zhǔn)確性。
上述技術(shù)方案具體包括:
一種模擬發(fā)聲方法,其中,設(shè)置一基于英文音標(biāo)的語音合成引擎,并預(yù)先建立英文音標(biāo)與中文音標(biāo)之間的對應(yīng)關(guān)系,還包括:
步驟S1,獲取一待發(fā)聲文本;
步驟S2,將所述待發(fā)聲文本中的文字分別轉(zhuǎn)化成對應(yīng)的基本音子,以形成包括依序排列的多個所述基本音子的音子序列;
步驟S3,于所述音子序列中區(qū)分出隸屬于中文音標(biāo)的所述基本音子以及隸屬于英文音標(biāo)的所述基本音子;
步驟S4,根據(jù)所述對應(yīng)關(guān)系將所述音子序列中隸屬于中文音標(biāo)的所述基本音子轉(zhuǎn)換成對應(yīng)的隸屬于英文音標(biāo)的所述基本音子,以形成一僅包括隸屬于英文音標(biāo)的所述基本音子的待發(fā)聲序列;
步驟S5,將所述待發(fā)聲序列送入所述語音合成引擎中,以合成對應(yīng)于所述待發(fā)聲文本的一段語音并輸出。
優(yōu)選的,該模擬發(fā)聲方法,其中,所述步驟S4中具體包括:
步驟S41,判斷隸屬于中文音標(biāo)的所述基本音子的類別:
若所述基本音子為隸屬于中文韻母的第一基本音子,則轉(zhuǎn)向步驟S42;
若所述基本音子為隸屬于中文聲母的第二基本音子,則轉(zhuǎn)向步驟S43;
步驟S42,采用對應(yīng)的英文音標(biāo)替代所述第一基本音子,隨后轉(zhuǎn)向步驟S44;
步驟S43,判斷所述第二基本音子是否符合預(yù)設(shè)的匹配策略:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于芋頭科技(杭州)有限公司,未經(jīng)芋頭科技(杭州)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711079101.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





