[發明專利]合成字典制作裝置及合成字典制作方法有效
| 申請號: | 201210058572.6 | 申請日: | 2012-03-07 |
| 公開(公告)號: | CN103021402A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 橘健太郎;森田真弘;籠島岳彥 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 劉瑞東;陳海紅 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 合成 字典 制作 裝置 制作方法 | ||
1.一種合成字典制作裝置,其特征在于,具備:
句子存儲單元,其存儲預定的N個(N是自然數,N≥2)句子;
提示單元,其向用戶提示從上述句子存儲單元存儲的上述N個句子依次選擇的第1句子;
錄制單元,其將朗讀上述第1句子的用戶的聲音錄制,將該錄制波形與上述第1句子相關聯存儲;
要否判斷單元,其在上述錄制單元中存儲M個(M是自然數,1≤M<N)上述第1句子的錄制波形的狀態下,根據來自用戶的聲音合成字典的制作指示、上述M和上述錄制單元存儲的全部上述錄制波形的數據量中的至少一個,判斷要否制作聲音合成字典;
字典制作單元,其在上述要否判斷單元判斷需要聲音合成字典的制作的場合,使用上述錄制單元存儲的上述錄制波形及與其相關聯的上述第1句子,制作聲音合成字典;和
聲音合成單元,其使用由上述字典制作單元制作的聲音合成字典,將第2句子變換為合成波形。
2.如權利要求1所述的合成字典制作裝置,其特征在于,還具備:
音質評價單元,其評價上述合成波形的音質。
3.如權利要求2所述的合成字典制作裝置,其特征在于,
在上述音質評價單元中評價上述合成波形的音質沒有問題的場合,上述提示單元停止向用戶提示上述第1句子。
4.如權利要求2或3所述的合成字典制作裝置,其特征在于,
在上述音質評價單元中評價上述合成波形的音質沒有問題的場合,上述錄制單元停止上述用戶的聲音的錄制。
5.如權利要求2所述的合成字典制作裝置,其特征在于,
上述聲音合成單元中的上述第2句子是上述句子存儲單元存儲的上述N個句子的某個句子,
上述音質評價單元,根據上述錄制單元存儲的與上述第2句子對應的上述錄制波形和上述合成波形的相似度,評價上述合成波形的音質。
6.如權利要求2所述的合成字典制作裝置,其特征在于,
上述音質評價單元取得來自試聽上述合成波形的用戶的上述合成波形的評價。
7.如權利要求1所述的合成字典制作裝置,其特征在于,
上述字典制作單元根據上述M或者上述數據量,切換聲音合成字典的制作方法。
8.如權利要求7所述的合成字典制作裝置,其特征在于,
上述字典制作單元在上述M或者上述數據量低于預定的閾值的場合,用適應方式制作聲音合成字典。
9.如權利要求1所述的合成字典制作裝置,其特征在于,
上述錄制單元判斷上述用戶的聲音的錄制狀態,將判斷為適當錄制的錄制波形與上述第1句子相關聯存儲。
10.一種合成字典制作方法,其特征在于,具備:
提示步驟,向用戶提示從句子存儲單元存儲的N個(N是自然數,N≥2)句子依次選擇的第1句子;
錄制步驟,將朗讀上述第1句子的用戶的聲音錄制,將該錄制波形與上述第1句子相關聯存儲;
要否判斷步驟,在上述錄制單元中存儲M個(M是自然數,1≤M<N)上述第1句子的錄制波形的狀態下,根據來自用戶的聲音合成字典的制作指示、上述M和上述錄制步驟中存儲的全部上述錄制波形的數據量中的至少一個,判斷要否制作聲音合成字典;
字典制作步驟,在上述要否判斷步驟判斷需要聲音合成字典的制作的場合,使用上述錄制步驟中存儲的上述錄制波形及與其相關聯的上述第1句子,制作聲音合成字典;和
聲音合成步驟,使用由上述字典制作步驟制作的聲音合成字典,將第2句子變換為合成波形。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210058572.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種翻蓋式下水器
- 下一篇:水電站廠房墻體與板梁分期澆筑的連接方法及結構





