[發明專利]一種嵌入式平臺語音合成系統及其方法無效
| 申請號: | 200710098522.X | 申請日: | 2007-04-19 |
| 公開(公告)號: | CN101114446A | 公開(公告)日: | 2008-01-30 |
| 發明(設計)人: | 徐磊 | 申請(專利權)人: | 北京中星微電子有限公司 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 | 代理人: | 陳紅;梁揮 |
| 地址: | 100083北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 嵌入式 平臺 語音 合成 系統 及其 方法 | ||
1.一種嵌入式平臺語音合成系統,用于在嵌入式平臺上進行文語轉換,包括:
語音庫,用于存儲語音數據;
算法庫,調用與所輸入的文本數據相對應的語音數據,并將所述語音數據合成為語音后輸出,其特征在于,所述系統還包括:
用于存儲所述已合成語音的第一緩存單元和第二緩存單元;以及
控制裝置,用于控制所述第一緩存單元和所述第二緩存單元中已合成語音的讀寫。
2.如權利要求1所述的系統,其特征在于,所述控制裝置交替讀寫所述第一緩存單元和所述第二緩存單元。
3.如權利要求2所述的系統,其特征在于,所述第一緩存單元和第二緩存單元的每一個的容量均包含多個幀,幀的數值滿足關系式:
T_frame*N=T_max+T_ave*(N-1);
其中,T_frame表示一幀語音的時間長度,T_max表示單幀語音合成最大時間,T_ave表示每幀語音的平均合成時間,N表示幀數。
4.如權利要求3所述的系統,其特征在于,每幀語音的平均合成時間T_ave小于一幀語音的時間長度T_frame,且單幀語音合成最大時間T_max大于一幀語音的時間長度T_frame。
5.如權利要求3所述的系統,其特征在于,所述第一緩存單元和第二緩存單元的容量相等。
6.一種嵌入式平臺語音合成方法,用于在嵌入式平臺上進行文語轉換,包括步驟:
設置一個語音庫,用于存儲語音數據;
設置一個算法庫,通過調用與所輸入的文本數據相對應的語音數據,將所述語音數據合成為語音后輸出;
設置第一緩存單元和第二緩存單元,用于存儲所述已合成語音;以及
設置一個控制裝置,用于控制所述第一緩存單元和所述第二緩存單元中已合成語音的讀寫。
7.如權利要求6所述的方法,其特征在于,該設置一個控制裝置以控制合成語音的讀寫步驟還包括:
將該合成語音順序地寫入到第一緩存單元;
讀取第一緩存單元中的已合成語音;
將該合成語音再順序地寫入到第二緩存單元中;
讀取該第二緩存單元中的已合成語音。
8.如權利要求7所述的方法,其特征在于,如果判斷該第一緩存單元被寫滿后,讀取第一緩存單元中的已合成語音的步驟和將該合成語音再順序地寫入到第二緩存單元中的步驟是同時進行的。
9.如權利要求8所述的方法,其特征在于,讀取該第二緩存單元中的已合成語音的步驟是在判斷該第一緩存單元中的合成語音被全部讀取和判斷該第二緩存單元被寫滿后執行的。
10.如權利要求9所述的方法,其特征在于,如果判斷該第一緩存單元的合成語音已被全部讀取時該第二緩存單元未被寫滿,該方法包括
在輸出第一緩存單元的合成語音時,在句與句之間中斷播放。
11.如權利要求10所述的方法,其特征在于,還包括
從該第一緩存單元讀取一幀已合成語音;
判斷其信號幅值;
如果該信號幅值為零,并且該第二緩存單元未寫滿時,進行中斷播放直到該第二緩存單元被寫滿;
如果該幅值不等于零,繼續讀取下一幀合成語音。
12.如權利要求6所述的方法,其特征在于,所述第一緩存單元和第二緩存單元的每一個的容量均包括多個幀,該幀數值滿足關系式:
T_frame*N=T_max+T_ave*(N-1);
其中,T_frame表示一幀語音的時間長度,T_max表示單幀語音合成最大時間,T_ave表示每幀語音的平均合成時間,N表示幀數。
13.如權利要求12所述的方法,其特征在于,所述第一緩存單元和第二緩存單元的容量相等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中星微電子有限公司,未經北京中星微電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710098522.X/1.html,轉載請聲明來源鉆瓜專利網。





