[發(fā)明專利]用于生成語音譜的方法有效
| 申請?zhí)枺?/td> | 200610135662.5 | 申請日: | 2006-10-20 |
| 公開(公告)號: | CN101165776A | 公開(公告)日: | 2008-04-23 |
| 發(fā)明(設(shè)計(jì))人: | 曹振海;祖漪清 | 申請(專利權(quán))人: | 摩托羅拉公司 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L13/02;G10L13/04;G10L15/08;G10L15/14 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 | 代理人: | 康建忠 |
| 地址: | 美國伊*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 生成 語音 方法 | ||
1.一種用于從輸入文字生成語音譜的方法,該方法包括:
將與輸入文字關(guān)聯(lián)的音素的長度與多個模型狀態(tài)相調(diào)準(zhǔn);
通過為所述多個模型狀態(tài)中的每一狀態(tài)從多混合高斯密度模型狀態(tài)中選擇混合來生成狀態(tài)序列;
通過使用狀態(tài)序列為輸入文字生成語音參數(shù)序列;以及
將語音參數(shù)序列轉(zhuǎn)換為語音譜。
2.如權(quán)利要求1所述的方法,其中,所述模型狀態(tài)包括隱馬爾可夫模型狀態(tài)。
3.如權(quán)利要求1所述的方法,其中,將語音參數(shù)序列轉(zhuǎn)換為語音譜的步驟包括:使用線性預(yù)測編碼譜平滑來消除所述多個模型狀態(tài)中的狀態(tài)之間的不連續(xù)性。
4.如權(quán)利要求1所述的方法,其中,為所述多個模型狀態(tài)中的每一狀態(tài)從多混合高斯密度模型狀態(tài)中選擇混合的步驟包括:為使用文字語料所計(jì)算的每一模型狀態(tài)定義默認(rèn)混合。
5.如權(quán)利要求1所述的方法,其中,所述語音參數(shù)序列是Mel頻率倒譜系數(shù)序列。
6.如權(quán)利要求1所述的方法,其中,將語音參數(shù)序列轉(zhuǎn)換為語音譜的步驟包括:使用逐幀音調(diào)和能量信息。
7.如權(quán)利要求1所述的方法,其中,將語音參數(shù)序列轉(zhuǎn)換為語音譜的步驟包括:得到線性預(yù)測編碼模型。
8.如權(quán)利要求1所述的方法,其中,將語音參數(shù)序列轉(zhuǎn)換為語音譜的步驟包括:處理先前幀的相位、當(dāng)前幀的音調(diào)以及當(dāng)前幀的Mel頻率倒譜系數(shù)。
9.如權(quán)利要求1所述的方法,其中,從多混合高斯密度模型狀態(tài)中選擇的混合包括最大混合權(quán)重。
10.如權(quán)利要求1所述的方法,還包括:
基于在電子設(shè)備的麥克風(fēng)處接收的話語發(fā)音生成輸入文字;
將輸入文字轉(zhuǎn)換為模型序列;以及
在電子設(shè)備的揚(yáng)聲器上播放語音譜。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于摩托羅拉公司,未經(jīng)摩托羅拉公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610135662.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種紅外探測的方法以及更新閥值的方法
- 下一篇:直發(fā)器
- 同類專利
- 專利分類





