[發明專利]一種語音基元的編碼與合成系統無效
| 申請號: | 201010215135.1 | 申請日: | 2010-06-30 |
| 公開(公告)號: | CN102314873A | 公開(公告)日: | 2012-01-11 |
| 發明(設計)人: | 孟智平 | 申請(專利權)人: | 上海視加信息科技有限公司 |
| 主分類號: | G10L13/06 | 分類號: | G10L13/06;G10L15/14;G10L19/14 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200051 上海市長寧*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 編碼 合成 系統 | ||
1.一種語音基元的編碼與合成系統,其特征在于包括以下模塊:預處理模塊、語音編碼模塊和語音解碼模塊;
所述預處理模塊負責采集分析連續語音流,對語音流進行切分,將其切分成語音基元序列,并通過聚類算法對大量的語音基元進行聚類分析,在此基礎上構建語音基元模型庫,以供語音編碼模塊和語音解碼模塊調用;
所述語音編碼模塊負責對接收到的語音流進行切分以獲取語音基元及其基頻F0,根據語音基元匹配算法從語音基元模型庫中獲得該語音基元所對應的編號,然后將語音基元編號、基頻F0和其他附屬信息按照相應編碼算法進行編碼,并采用壓縮算法對其進一步壓縮,然后將其打包發送;
所述語音解碼模塊負責接收語音編碼模塊傳送過來的語音數據包,對其進行解壓縮,獲取語音基元編號,以該編號為檢索條件,查詢語音基元模型庫,提取該編號對應的語音基元信息,最終通過語音合成算法還原語音。
2.如權利要求1所述基于語音基元的語音編碼與合成系統,其特征在于:包括語音發送端和語音接收端;
所述語音發送端包括語音基元模型庫、語音編碼模塊;
所述語音接收端包括語音基元模型庫、語音解碼模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海視加信息科技有限公司,未經上海視加信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010215135.1/1.html,轉載請聲明來源鉆瓜專利網。





