[發(fā)明專(zhuān)利]中英文語(yǔ)音混合合成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110628882.6 | 申請(qǐng)日: | 2021-06-02 |
| 公開(kāi)(公告)號(hào): | CN113345408B | 公開(kāi)(公告)日: | 2022-12-27 |
| 發(fā)明(設(shè)計(jì))人: | 孫見(jiàn)青;梁家恩 | 申請(qǐng)(專(zhuān)利權(quán))人: | 云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司 |
| 主分類(lèi)號(hào): | G10L13/02 | 分類(lèi)號(hào): | G10L13/02;G10L13/08;G06F40/295 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100096 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中英文 語(yǔ)音 混合 合成 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及一種中英文語(yǔ)音混合合成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法包括:獲取待合成文本;判斷待合成文本中中文文字的數(shù)量大于還是小于英文單詞數(shù)量;若中文文字的數(shù)量大于所述英文單詞數(shù)量,對(duì)人名和/或地名以及中文文本按照中文方式合成語(yǔ)音;若中文文字的數(shù)量小于英文單詞數(shù)量,對(duì)人名和/或地名以及英文文本按照英文方式合成語(yǔ)音。本申請(qǐng)實(shí)施例中實(shí)現(xiàn)了將中文英文混合的文本合成語(yǔ)音,如將報(bào)紙上的中文英文混合的文本合成語(yǔ)音,即通過(guò)語(yǔ)音朗讀出來(lái),本申請(qǐng)實(shí)施例中通過(guò)比較中文文字的數(shù)量和英文單詞數(shù)量多少,對(duì)人名和/或地名、中文文本和英文文本采取不同的語(yǔ)音合成方式,與現(xiàn)有技術(shù)中合成的語(yǔ)音相比更地道。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音處理技術(shù)領(lǐng)域,具體涉及一種中英文語(yǔ)音混合合成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
目前,合成中英文語(yǔ)音時(shí),對(duì)合成文本進(jìn)行解析,合成方法有兩大類(lèi):用中文數(shù)據(jù)和英文數(shù)據(jù)分別構(gòu)建中文合成模型和英文合成模型,中文部分用中文合成模型合成,英文部分用英文合成模型合成;用中文數(shù)據(jù)和英文數(shù)據(jù)構(gòu)建模型,該模型同時(shí)支持中文合成和英文合成,中文部分和英文部分使用同一套模型合成。
但是,上述方法對(duì)于中英文混讀合成中的人名和地名,如果按照現(xiàn)有方案進(jìn)行合成,其發(fā)音不符合地道發(fā)音人的發(fā)音習(xí)慣,聽(tīng)起來(lái)不夠地道。
發(fā)明內(nèi)容
本發(fā)明提供一種中英文語(yǔ)音混合合成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),能夠解決合成的中英文語(yǔ)音混合不地道的技術(shù)問(wèn)題。
本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下:
第一方面,本發(fā)明實(shí)施例提供了一種中英文語(yǔ)音混合合成方法,包括:
獲取待合成文本;
判斷待合成文本中中文文字的數(shù)量大于還是小于英文單詞數(shù)量;
若中文文字的數(shù)量大于所述英文單詞數(shù)量,對(duì)人名和/或地名以及中文文本按照中文方式合成語(yǔ)音;
若中文文字的數(shù)量小于所述英文單詞數(shù)量,對(duì)人名和/或地名以及英文文本按照英文方式合成語(yǔ)音。
在一些實(shí)施例中,按照中文方式合成語(yǔ)音,包括:
判斷英文文本中是否包括人名和/或地名;
若判斷結(jié)果為英文文本中包括所述人名和/或地名;
將人名和/或地名以及中文文本轉(zhuǎn)換成國(guó)際音標(biāo)輸入到中文合成模型合成語(yǔ)音;以及將英文文本轉(zhuǎn)換成國(guó)際音標(biāo)輸入到英文合成模型合成語(yǔ)音。
在一些實(shí)施例中,按照英文方式合成語(yǔ)音,包括:
判斷中文文本中是否包括人名和/或地名;
若判斷結(jié)果為中文文本中包括所述人名和/或地名;
將人名和/或地名以及英文文本轉(zhuǎn)換成國(guó)際音標(biāo)輸入到英文合成模型合成語(yǔ)音;以及將中文文本轉(zhuǎn)換成國(guó)際音標(biāo)輸入到中文合成模型合成語(yǔ)音。
在一些實(shí)施例中,中文合成模型的訓(xùn)練步驟如下:
獲取多個(gè)中文文本國(guó)際音標(biāo)以及語(yǔ)音對(duì);
將多個(gè)中文文本國(guó)際音標(biāo)作為輸入,對(duì)應(yīng)的語(yǔ)音作為輸出進(jìn)行訓(xùn)練得到中文合成模型。
在一些實(shí)施例中,英文合成模型的訓(xùn)練步驟如下:
獲取多個(gè)英文文本國(guó)際音標(biāo)以及語(yǔ)音對(duì);
將多個(gè)英文文本國(guó)際音標(biāo)作為輸入,對(duì)應(yīng)的語(yǔ)音作為輸出進(jìn)行訓(xùn)練得到英文合成模型。
在一些實(shí)施例中,判斷中文文本中是否包括人名和/或地名是通過(guò)命名實(shí)體識(shí)別模型判斷的。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司,未經(jīng)云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110628882.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L13-00 語(yǔ)音合成;文本-語(yǔ)音合成系統(tǒng)
G10L13-02 .產(chǎn)生合成語(yǔ)音的方法;語(yǔ)音合成設(shè)備
G10L13-06 .語(yǔ)音合成設(shè)備中使用的基本語(yǔ)音單位;級(jí)聯(lián)規(guī)則
G10L13-08 .文本分析或文本以外的語(yǔ)音合成參數(shù)的產(chǎn)生,例如語(yǔ)義圖翻譯為音素、韻律產(chǎn)生、重音或聲調(diào)測(cè)定
G10L13-04 ..語(yǔ)音合成系統(tǒng)的零部件,例如合成設(shè)備結(jié)構(gòu)或存儲(chǔ)器管理
- 對(duì)中英文語(yǔ)音信號(hào)進(jìn)行識(shí)別的方法和裝置
- 語(yǔ)句級(jí)中英文混合輸入方法
- 帶有中英文手寫(xiě)區(qū)域的PC金屬鍵盤(pán)
- 基于中英文混合詞典的語(yǔ)音識(shí)別方法及裝置
- 基于中英文混合詞典的語(yǔ)音識(shí)別方法及裝置
- 一種中英文對(duì)照益智軟件及使用方法
- 一種中英文混合語(yǔ)音識(shí)別方法及裝置
- 一種中英文論文數(shù)據(jù)分類(lèi)與查詢(xún)方法
- 一種基于學(xué)術(shù)文獻(xiàn)的中英雙語(yǔ)詞典構(gòu)建方法
- 一種計(jì)算機(jī)中英文混和輸入的中英文切換方案
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





