[發(fā)明專利]一種對普通話重音進行層次化建模和預(yù)測的方法有效
| 申請?zhí)枺?/td> | 201110200330.1 | 申請日: | 2011-07-18 |
| 公開(公告)號: | CN102254554A | 公開(公告)日: | 2011-11-23 |
| 發(fā)明(設(shè)計)人: | 陶建華;李雅 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L13/08 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 周國城 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 普通話 重音 進行 層次 建模 預(yù)測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及人機交互中語音合成技術(shù)領(lǐng)域,尤其涉及一種對普通話重音進行層次化建模和預(yù)測的方法,具體地涉及普通話句重音、詞重音的建模,以及基于最大熵模型的詞重音、句重音的兩層重音預(yù)測方法。
背景技術(shù)
準(zhǔn)確的重音描述以及從文本信息中預(yù)測重音信息一直是語音合成至關(guān)重要的一步,是提高合成語音表現(xiàn)力、構(gòu)建和諧人機交互技術(shù)的重要組成部分。重音模型能夠刻畫出語音中的抑揚頓挫與輕重緩急,進而提高合成語音的表現(xiàn)力和自然度。重音的建模與預(yù)測對語音合成,人機交互等的發(fā)展具有重要意義。
雖然,在這個領(lǐng)域已經(jīng)有很多的研究工作,但是重音建模與預(yù)測還有很多問題至今沒有很好的解決。其中,具有重音標(biāo)注的用于語音合成的語料庫較少,且在僅有的幾個語料庫中,都強調(diào)重音音節(jié)的分析研究,沒有對輕音音節(jié)的分析。但是,從語音合成實驗結(jié)果來看,合成結(jié)果之所以不理想,重要原因之一就是現(xiàn)有合成系統(tǒng)忽略了語音輕音的問題。輕音除了對語流中的輕重緩急起到一定的襯托作用,它還具有表義的作用,即具有區(qū)分詞義的作用。
因此,為了提高合成語音的自然度和表現(xiàn)力,有必要加強輕音音節(jié)的研究,同時進一步提高重音音節(jié)的研究。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題
為了解決現(xiàn)有技術(shù)問題,本發(fā)明的主要目的是要提出一種對普通話重音進行層次化建模和預(yù)測的方法,以更精確的描述語音中用于表現(xiàn)韻律凸顯的重音現(xiàn)象,同時能夠從任意輸入的文本得到較為細(xì)致的重音等級標(biāo)注結(jié)果。
(二)技術(shù)方案
為達(dá)到上述目的,本發(fā)明提供了一種對普通話重音進行層次化建模和預(yù)測的方法,該方法采用層次化重音描述體系對普通話重音進行描述,包括:
選擇合適的重音描述體系,創(chuàng)建層級標(biāo)注的重音語料庫;
訓(xùn)練生成韻律詞重音預(yù)測模型;
訓(xùn)練生成句重音預(yù)測模型;以及
根據(jù)韻律詞重音模型與句重音預(yù)測模型結(jié)果綜合生成每個音節(jié)的重音標(biāo)注結(jié)果。
上述方案中,所述采用層次化重音描述體系對普通話重音進行描述,是采用句重音與韻律詞重音對普通話重音進行描述,以重音凸顯范圍將普通話重音分為句重音與韻律詞重音兩個層級,對于句重音層級采用重音音節(jié)的建模分析,而對于韻律詞重音層級采用輕音音節(jié)的建模分析。所述句重音用于表明在句子層面凸顯的韻律詞,所述韻律詞重音用于表明韻律詞內(nèi)部音節(jié)之間的凸顯對比。
上述方案中,所述選擇合適的重音描述體系,是以重音凸顯范圍將普通話重音分為句重音與韻律詞重音兩個層級,然后針對不同的層級,選擇不同的重音標(biāo)注單元。所述重音標(biāo)注單元分為兩類:在韻律詞重音中,重音標(biāo)注單元為單個韻律詞;在句重音標(biāo)注中,標(biāo)注單元為句子。所述創(chuàng)建層級標(biāo)注的重音語料庫,是在錄音室錄制語音數(shù)據(jù),并進行音節(jié)切分,韻律邊界標(biāo)注,最后按照標(biāo)注單元的重音凸顯程度高低分別標(biāo)注為3、2、1三個等級。
上述方案中,所述訓(xùn)練生成韻律詞重音預(yù)測模型,是訓(xùn)練一個能夠預(yù)測當(dāng)前音節(jié)在其所在的韻律詞范圍內(nèi)是輕音的概率的模型,訓(xùn)練的具體過程為:采用一文本特征參數(shù)提取模塊,得到與韻律詞重音特征相關(guān)的文本特征參數(shù)F1作為模型訓(xùn)練輸入,利用最大熵模型,得到有關(guān)韻律詞內(nèi)部輕音節(jié)與非輕音節(jié)的文本特征差異,進而通過模型訓(xùn)練得到音節(jié)是輕音的概率,建立韻律詞重音預(yù)測模型。所述韻律詞重音預(yù)測模型具有一用于輸出韻律詞重音預(yù)測結(jié)果的輸出端。
上述方案中,所述訓(xùn)練生成句重音預(yù)測模型,是訓(xùn)練一個能夠預(yù)測當(dāng)前音節(jié)在句子范圍內(nèi)是重音的概率的模型,訓(xùn)練的具體過程為:采用一文本特征參數(shù)提取模塊,得到與句子級別重音預(yù)測相關(guān)的文本特征參數(shù)F2作為模型輸入,利用最大熵模型,訓(xùn)練有關(guān)句子層級重音節(jié)與非重音節(jié)的文本特征差異,進而通過模型訓(xùn)練得到音節(jié)是重音的概率,建立句重音預(yù)測模型。所述句重音預(yù)測模型具有一輸出句重音預(yù)測結(jié)果的輸出端。
上述方案中,所述根據(jù)韻律詞重音模型與句重音預(yù)測模型結(jié)果綜合生成每個音節(jié)的重音標(biāo)注結(jié)果,是將韻律詞重音預(yù)測結(jié)果和句重音預(yù)測結(jié)果采用公式進行加權(quán)綜合,然后輸出綜合后的層級重音標(biāo)注信息;其中,和分別是音節(jié)在當(dāng)前韻律詞和句子中的重音凸顯度,是韻律詞在當(dāng)前句子中的重音凸顯度。
(三)有益效果
從上述技術(shù)方案可以看出,本發(fā)明具有以下有益效果:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110200330.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





