[發明專利]基于組塊分析的韻律短語預測方法有效
| 申請號: | 200610073102.1 | 申請日: | 2006-04-04 |
| 公開(公告)號: | CN101051458A | 公開(公告)日: | 2007-10-10 |
| 發明(設計)人: | 陶建華;董宏輝 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/00 |
| 代理公司: | 中科專利商標代理有限責任公司 | 代理人: | 周國城 |
| 地址: | 100080北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分析 韻律 短語 預測 方法 | ||
1.一種基于組塊分析的韻律短語預測方法,其特征在于:用于語音合成系統中文本分析的韻律短語預測,將系統接收到的或輸入的任意文字串轉換成帶有韻律短語停頓標注的文字形式,將組塊作為韻律短語預測的基本單元,步驟包括:
創建韻律短語標注語料庫,選擇合適的組塊規范作為韻律短語預測的基本分析單元,利用組塊分析單元從文本生成組塊信息;
訓練生成組塊合并模型是利用韻律短語標注語料庫估計組塊合并模型;
訓練生成韻律短語邊界必停點的預測模型是利用韻律短語標注語料庫訓練支持向量機識別器,得到韻律短語的必停點的預測器;
訓練生成韻律短語的節律平衡模型是利用韻律短語標注語料庫訓練節律平衡模型;
基于組塊合并模型、韻律短語邊界必停點的預測模型、長度約束模型執行生成韻律短語。
2.根據權利要求1所述的基于組塊分析的韻律短語預測方法,其特征在于所述組塊規范作為韻律短語預測的基本分析單元步驟包括:生成組塊定義信息;生成組塊長度信息定義。
3.根據權利要求1或2所述的基于組塊分析的韻律短語預測方法,其特征在于所述生成組塊合并模型步驟包括:
訓練生成組塊在韻律短語中連接概率;訓練生成組塊合并概率閾值。
4.根據權利要求1所述的基于組塊分析的韻律短語預測方法,其特征在于所述生成韻律短語邊界的必停點的預測模型步驟包括:
基于支持向量機識別器的預測模型,生成詞性和位置信息特征。
5.根據權利要求1所述的基于組塊分析的韻律短語預測方法,其特征在于所述生成節律的平衡模型步驟包括:
將各個韻律短語的長度替代各個韻律短語的位置;
以韻律短語長度為單位組成的語料,訓練生成三元、二元模型。
6.根據權利要求1所述的基于組塊分析的韻律短語預測方法,其特征在于所述執行生成韻律短語的步驟包括:
a.利用組塊合并模型,合并組塊,確定韻律的不可停頓點及可停頓點;
b.基于韻律的可停頓點,利用支持向量機識別器確定韻律的必停頓的位置;
c.利用韻律短語的節律平衡模型尋找余下的韻律短語邊界。
7.根據權利要求6所述的基于組塊分析的韻律短語預測方法,其特征在于,所述生成韻律短語步驟包括:將韻律詞邊界確定為不可停頓點、必須停頓的位置、及余下的可停可不停的位置;將可停可不停的位置置為停或者不停,生成k種可能的停頓方式;從這k種可能的停頓方式中,選出最有可能的停頓方式。
8.根據權利要求2所述的基于組塊分析的韻律短語預測方法,其特征在于所述生成組塊定義信息的步驟包括:
組塊的定義要求包括:名詞組塊、形容詞組塊、動詞組塊、介詞組塊;選擇一個組塊長度定義較小的組塊規范。
9.根據權利要求1所述的基于組塊分析的韻律短語預測方法,其特征在于,所述節律平衡模型描述韻律短語長度分布關系,生成k種可能的韻律短語結構;利用所述的短語長度,選擇長度分配最優的一組短語結構。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610073102.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種殼聚糖復配的有機茶葉面肥及其制備方法
- 下一篇:數字式電流綜合器





