[發明專利]字音轉換預測以及語音合成的方法和裝置有效
| 申請號: | 200710089176.9 | 申請日: | 2007-03-20 |
| 公開(公告)號: | CN101271687A | 公開(公告)日: | 2008-09-24 |
| 發明(設計)人: | 易立夫;郝杰 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/06;G10L13/08 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 李崢;劉薇 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字音 轉換 預測 以及 語音 合成 方法 裝置 | ||
1.?一種數據驅動訓練字音轉換概率預測模型的方法,包括:
利用與字音轉換預測相關的多個屬性和至少一部分上述屬性的組合生成初始字音轉換概率預測模型,其中每個上述屬性或上述屬性的組合被作為一項;
計算上述字音轉換概率預測模型中每一上述項的重要性;
刪除上述計算出的重要性最低的項;
利用剩余的項重新生成字音轉換概率預測模型;
判斷上述重新生成的字音轉換概率預測模型是否最優;以及
如果上述字音轉換概率預測模型被判斷為不是最優,則重復上述計算每一項的重要性的步驟及其之后的步驟。
2.?根據權利要求1所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述與字音轉換預測相關的多個屬性包括:語言類型和語音類型的屬性。
3.?根據權利要求1所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述與字音轉換預測相關的多個屬性包括:從詞性、上下文中的詞和詞長中選擇的任意多個屬性。
4.?根據權利要求1至3任意一項所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述字音轉換概率預測模型是廣義線性模型(GLM)。
5.?根據權利要求4所述的數據驅動訓練字音轉換概率預測模型的方法,還包括:擴展上述廣義線性模型,得到條件隨機場(CRF)模型;使用判斷為最優的廣義線性模型的每一項的屬性或屬性的組合對上述條件隨機場模型進行訓練,并將訓練得到的條件隨機場模型作為上述字音轉換概率預測模型。
6.?根據權利要求1所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述至少一部分上述屬性的組合包括上述多個與字音轉換預測相關的屬性的全部2階的屬性組合。
7.?根據權利要求1至6任意一項所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述計算上述字音轉換概率預測模型中每一上述項的重要性的步驟包括:利用F檢驗(F-test)計算每一項的重要性。
8.?根據權利要求1至7任意一項所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述判斷上述重新生成的字音轉換概率預測模型是否最優的步驟包括:利用貝葉斯信息準則(BIC)判斷上述重新生成的字音轉換概率預測模型是否最優。
9.?根據權利要求8所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述判斷上述重新生成的字音轉換概率預測模型是否最優的步驟包括:
計算下式
BIC=Nlog(SSE/N)+plog?N,
其中,SSE表示預測誤差e的平方和,N表示訓練樣本的數量;
當上式中的BIC最小時,判斷字音轉換概率預測模型為最優。
10.?根據權利要求1至9任意一項所述的數據驅動訓練字音轉換概率預測模型的方法,其中,上述字音轉換概率滿足伯努利分布。
11.?一種構建字音轉換概率預測模型的方法,包括:
形成輕聲多音字的訓練樣本集合與非輕聲多音字的訓練樣本集合;以及
分別基于上述輕聲多音字的訓練樣本集合與上述非輕聲多音字的訓練樣本集合,利用上述權利要求1至10的任意一項所述的數據驅動訓練字音轉換概率預測模型的方法,構建詞無關的字音轉換概率預測模型和詞相關的字音轉換概率預測模型。
12.?根據權利要求11所述的構建字音轉換概率預測模型的方法,其中,所述形成輕聲多音字的訓練樣本集合與非輕聲多音字的訓練樣本集合的步驟包括:
統計一個文本語料庫中的多音字的每個讀音的發生概率;以及
根據上述發生概率,將上述文本語料庫中的多音字分類為輕聲多音字和非輕聲多音字,以形成輕聲多音字的訓練樣本集合與非輕聲多音字的訓練樣本集合。
13.?根據權利要求12所述的構建字音轉換概率預測模型的方法,還包括:
計算上述文本語料庫中的多音字的出現頻率;
比較上述計算出的出現頻率和閾值;以及
選擇上述出現頻率大于閾值并且在上述非輕聲多音字的訓練樣本集合中的多音字作為高頻多音字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710089176.9/1.html,轉載請聲明來源鉆瓜專利網。





