[發明專利]混合型語音合成系統無效
| 申請號: | 200910030596.9 | 申請日: | 2009-04-24 |
| 公開(公告)號: | CN101872614A | 公開(公告)日: | 2010-10-27 |
| 發明(設計)人: | 韓松 | 申請(專利權)人: | 韓松 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210008 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 混合 語音 合成 系統 | ||
技術領域
本發明涉及一種語音合成系統,尤其是一種混合型語音合成系統。
背景技術
語音合成是計算機技術領域中的一個分支,主要功能是把一個給定的輸入文本,通過計算機程序,自動轉化為語音數據,隨后可由輸出設備如揚聲器或耳機等輸出。不同的自然語音的語音合成方法一般各不相同。混合型語音合成系統是語音合成系統的一類,它包括一個合成引擎和一個預先錄入的語音數據庫,合成引擎通過計算機軟件查找語音數據庫中匹配的讀音把文本轉化為語音。但是,通過這種系統計算機所發出的語音不連續,輸出的語音不流暢、不自然。
發明內容
為解決上述技術問題,本發明提出一種混合型語音合成系統,包括語音庫、語音合成引擎,所述語音庫為混合型語音庫,包括綜合錄入的真人發音和計算機處理的非真人發音,其語音庫中詞語與句子為真人發音,單個字詞為非真人發音。
所述混合型語音庫制作過程包括以下步驟:
A.對語音數據進行統計,分析單個字、詞或句子可能出現的所有發音,這一步驟必須具備完備性,即所收集和統計的數據必須覆蓋一種自然語言的全部;
B.對字、詞、句子的可能發音進行錄音,根據適用的目標應用程序的要求,進行有損或無損壓縮,編譯成二進制文件,另外創建索引信息,應用計算機程序根據一個字、詞或句子查找到語音的二進制文件;
C.搜集語言的材料庫,分析字詞句發音的例外情況,對于例外情況,建立規則集,所述規則集對于給定的字詞以及所處的上下文信息,準確地給出最佳的發音;
D.把語音庫,規則集壓縮創建索引,生成混合型語音庫。所述語音合成引擎核心功能是把輸入的文本轉換為語音,轉換過程包括以下步驟:
A.對輸入的自然語音文本進行分析,該分析過程包括:語句的切分,尋找切分最理想的粒度,分析語句中可能出現的特殊情況,對于有多種發音可能或者可能動態改變發音的情況,要把待發音的字、詞句以及上下文的情況進行編碼,生成一個可以被上下文中提及的規則集識別的輸入情況;
B.對切分好的字、詞、句或段落,查找語音庫或者規則集,按索引獲取語音信息;
C.合成,優化處理并輸出。
由于本發明所述語音庫為混合型語音庫,包括綜合錄入的真人發音和計算機處理的非真人發音,語音庫中詞語與句子為真人發音,真人發音具有語言流暢、清楚、連續的優點,因此非常適用以下領域(不限于所列):
1、無線平臺的語音合成。比如智能手機,手持電子設備平臺。這些平臺通常只有有限的存儲空間。在這些平臺上的帶有語音的應用程序可以使用本語音合成系統,達到節省存儲空間,提高合成質量的目的。
2、導航系統。GPS和車載導航系統需要高質量的語音導航,在需要的時候對駕駛員做出提示。這是本系統一個非常理想的應用場合。此外,任何需要對操作人員進行語音提示或指令,而需要盡量少分散操作元注意力的應用場合,均可使用本語音合成系統。
3、公共場合的廣播系統。目前廣播系統大多使用人工廣播,既浪費人力資源,也容易出錯,而廣播的內容,往往是程序輸出的結果(比如車站機場的提示信息,均是調度軟件系統的輸出數據)。如果把這些結果數據直接輸入到本語音合成系統中,可以降低人員成本,而且不必擔心認為因素導致的錯誤。
有益效果
與傳統的文字到語音的自動合成技術對比,本發明具有以下優點:
1、合成結果效果好,語音連續,輸出的語言流暢、自然。經過本系統合成的語音,可以達到真人發音的效果;
2、體積小。本系統自帶的語音庫,體積通常在5M字節以下,體積小,效率高,適合各種計算平臺,包括移動手機平臺;
3、語音數據庫不隨待覆蓋文本的大小增大而增大;
具體實施方式
實施例1:
一種混合型語音合成系統,包括語音庫、語音合成引擎,所述語音庫為混合型語音庫,包括綜合錄入的真人發音和計算機處理的非真人發音,其語音庫中詞語與句子為真人發音,單個字詞為非真人發音。
所述混合型語音庫制作過程包括以下步驟:
A、對語音數據進行統計,分析單個字、詞或句子可能出現的所有發音,這一步驟必須具備完備性,即所收集和統計的數據必須覆蓋一種自然語言的全部;
B、對字、詞、句子的可能發音進行錄音,根據適用的目標應用程序的要求,進行有損或無損壓縮,編譯成二進制文件,另外創建索引信息,應用計算機程序根據一個字、詞或句子查找到語音的二進制文件;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于韓松,未經韓松許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910030596.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種有機光電器件及其制備方法
- 下一篇:可插入SIM卡的網絡文件播放系統





