[發明專利]韻律結構分析裝置與語音合成的裝置及方法有效
| 申請號: | 201310168511.X | 申請日: | 2013-05-09 |
| 公開(公告)號: | CN103971673B | 公開(公告)日: | 2018-05-22 |
| 發明(設計)人: | 陳信宏;王逸如;江振宇;謝喬華 | 申請(專利權)人: | 財團法人交大思源基金會 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 李鎮江 |
| 地址: | 中國臺灣*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 韻律 結構 分析 裝置 語音 合成 方法 | ||
本申請提供一種語音合成之裝置,其包括一階層式韻律模塊,提供一階層式韻律模型;一韻律結構分析單元,接收一低級語言參數、一高級語言參數及一第一韻律參數,且根據該高級語言參數、該低級語言參數、該第一韻律參數及該階層式韻律模塊,產生至少一韻律標記;以及一韻律參數合成單元,根據該階層式韻律模塊、該低級語言參數及該韻律標記來合成一第二韻律參數。
技術領域
本發明系關于一種語音裝置,尤指一種語音合成裝置。
背景技術
在傳統以音段為基礎之語音編碼中,音段對應之韻律訊息通常使用量化直接對韻律參數進行編碼,而沒有考慮到使用具有語言意義之韻律模型來進行參數化韻律編碼。其中有以將音節內音素對應之長度及音高軌跡進行編碼,編碼方式是以預儲存之具有代表性的音節內音素長度及音高軌跡群組樣版,來表示音節內音素的音長及音高軌跡信息,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;以對于音高軌跡進行編碼,將音高軌跡以片段之直線表示其值,音高軌跡之訊息以對這些片段直線的斜率及端點值表示,于碼書(codebook)中儲存具有代表性的片段直線樣板,音高軌跡便以此碼書進行編碼,此方法簡單,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;還有以對于詞的音長進行純量量化,對于詞的音高軌跡以詞平均音高及詞音高斜率表示之,并對平均值及斜率進行純量量化,并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;以對于音素的音長、音高位階先進行正規化,其正規化方法為是將音素音長及音高位階的觀察值,分別扣掉該音素類別之平均音長及平均音高位階,最后將正規化之音素音長及音高位階進行量化編碼,此方法可降低傳輸位率,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;還有以將語音切成不等音框數的語音音段,每個音段的音高軌跡以此音段的平均音高表示之,而能量軌跡是以向量量化表示之,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;以將語音切成音段,對于音段音高軌跡、音段長度及音段能量軌跡進行編碼,將音高軌跡以片段之直線表示其值,音高軌跡之訊息以對這些片段直線的端點值及時間值表示編碼,而音段長度以正規化地音段長度用純量量化表示,其正規化方法為是將音段長度的觀察值扣掉該音段類別之平均長度,音段能量軌跡是以DTW的方式對于預儲存之樣版進行比對,以誤差值最小之樣版編號為編碼所需信息,另外也對DTW之路徑、音段起頭及結尾以樣板表示之能量誤差進行編碼,此方法并未考慮韻律產生模型,對于編碼后之語音亦不易進行韻律轉換;目前已有文獻關于將音段的音高軌跡以平均值表示之,并將此平均值以純量量化,此方法簡單,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;還有將音高軌跡以片段之直線表示其值,音高軌跡之訊息以對這些片段直線的端點的音高值及時間信息表示之,并將這些端點值以純量量化表示之,此方法簡單,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;還有以分段線性近似法(piecewise linear approximation,PLA)表示音段的音高,PLA里面包含音段端點的音高及時間信息、以及折點(critical point)的音高及時間信息,其中有文獻系以純量量化表示這些信息,及以向量量化表示這些PLA信息;還有文獻以傳統frame-based speechcoder的方法將每個frame的音高信息進行量化,雖然可將音高信息正確地表示,但相對data rate較高;還有將音段的音高軌跡以儲存于codebook中的音高軌跡樣板量化并編碼,此方法可以用極低的data rate將音高信息編碼,但distortion較大;還有文獻是將音段的時長直接進行純量量化,方法簡單,可完全保留原本音段的長度,但并未考慮韻律產生模型,對于編碼后之語音不易進行韻律轉換;還有將連續三個音段的長度以向量量化編碼,方法簡單,但并未考慮韻律產生模型,對于編碼后之語音亦不易進行韻律轉換;還有文獻提出一個以語音辨認為基礎的韻律編碼,它會有辨認錯誤引起的合成錯誤聲音的缺點,并且沒有后處理做聲音速度轉換的功能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于財團法人交大思源基金會,未經財團法人交大思源基金會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310168511.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:超薄電視機直下式反射光透鏡
- 下一篇:新型燈罩結構





