[發明專利]一種對普通話重音進行層次化建模和預測的方法有效
| 申請號: | 201110200330.1 | 申請日: | 2011-07-18 | 
| 公開(公告)號: | CN102254554A | 公開(公告)日: | 2011-11-23 | 
| 發明(設計)人: | 陶建華;李雅 | 申請(專利權)人: | 中國科學院自動化研究所 | 
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L13/08 | 
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周國城 | 
| 地址: | 100190 *** | 國省代碼: | 北京;11 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 普通話 重音 進行 層次 建模 預測 方法 | ||
1.一種對普通話重音進行層次化建模和預測的方法,其特征在于,該方法采用層次化重音描述體系對普通話重音進行描述,包括:
選擇合適的重音描述體系,創建層級標注的重音語料庫;
訓練生成韻律詞重音預測模型;
訓練生成句重音預測模型;以及
根據韻律詞重音模型與句重音預測模型結果綜合生成每個音節的重音標注結果。
2.根據權利要求1所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述采用層次化重音描述體系對普通話重音進行描述,是采用句重音與韻律詞重音對普通話重音進行描述,以重音凸顯范圍將普通話重音分為句重音與韻律詞重音兩個層級,對于句重音層級采用重音音節的建模分析,而對于韻律詞重音層級采用輕音音節的建模分析。
3.根據權利要求2所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述句重音用于表明在句子層面凸顯的韻律詞,所述韻律詞重音用于表明韻律詞內部音節之間的凸顯對比。
4.根據權利要求1所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述選擇合適的重音描述體系,是以重音凸顯范圍將普通話重音分為句重音與韻律詞重音兩個層級,然后針對不同的層級,選擇不同的重音標注單元。
5.根據權利要求4所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述重音標注單元分為兩類:在韻律詞重音中,重音標注單元為單個韻律詞;在句重音標注中,標注單元為句子。
6.根據權利要求5所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述創建層級標注的重音語料庫,是在錄音室錄制語音數據,并進行音節切分,韻律邊界標注,最后按照標注單元的重音凸顯程度高低分別標注為3、2、1三個等級。
7.根據權利要求1所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述訓練生成韻律詞重音預測模型,是訓練一個能夠預測當前音節在其所在的韻律詞范圍內是輕音的概率的模型,訓練的具體過程為:采用一文本特征參數提取模塊,得到與韻律詞重音特征相關的文本特征參數F1作為模型訓練輸入,利用最大熵模型,得到有關韻律詞內部輕音節與非輕音節的文本特征差異,進而通過模型訓練得到音節是輕音的概率,建立韻律詞重音預測模型。
8.根據權利要求7所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述韻律詞重音預測模型具有一用于輸出韻律詞重音預測結果的輸出端。
9.根據權利要求1所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述訓練生成句重音預測模型,是訓練一個能夠預測當前音節在句子范圍內是重音的概率的模型,訓練的具體過程為:采用一文本特征參數提取模塊,得到與句子級別重音預測相關的文本特征參數F2作為模型輸入,利用最大熵模型,訓練有關句子層級重音節與非重音節的文本特征差異,進而通過模型訓練得到音節是重音的概率,建立句重音預測模型。
10.根據權利要求1所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述句重音預測模型具有一輸出句重音預測結果的輸出端。
11.根據權利要求1所述的對普通話重音進行層次化建模和預測的方法,其特征在于,所述根據韻律詞重音模型與句重音預測模型結果綜合生成每個音節的重音標注結果,是將韻律詞重音預測結果和句重音預測結果采用公式進行加權綜合,然后輸出綜合后的層級重音標注信息;其中,和分別是音節在當前韻律詞和句子中的重音凸顯度,是韻律詞在當前句子中的重音凸顯度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110200330.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于自然語音識別的導航方法和系統
 - 下一篇:小型量子糾纏源教學系統
 





