[發明專利]合成字典制作裝置及合成字典制作方法有效
| 申請號: | 201210058572.6 | 申請日: | 2012-03-07 |
| 公開(公告)號: | CN103021402A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 橘健太郎;森田真弘;籠島岳彥 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 劉瑞東;陳海紅 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 合成 字典 制作 裝置 制作方法 | ||
優先權基礎申請等關聯申請的引用
本申請以日本專利申請2011-209989(申請日:2011年9月26日)為基礎,享受該申請的優先權。本申請通過參照該申請,包含該申請的全部內容。
技術領域
本發明的實施方式涉及合成字典(詞典)制作裝置及合成字典制作方法。
背景技術
已知有將任意的文本變換為合成波形的聲音合成技術。為了使用聲音合成技術再現某特定的用戶的音質,必須將該用戶的聲音大量錄制,使用該錄制波形制作聲音合成字典。為了實現該目的,提出了使用戶朗讀預定的多個句子,使用將其錄制(錄音)的錄制波形制作用戶定制的聲音合成字典的系統。
但是,上述系統中,聲音合成字典的制作中需要全部朗讀預定的句子的聲音的錄制波形,無法在錄制的中途階段確認合成波形的音質。從而,即使合成波形的音質足夠高,也產生用戶繼續錄制等的狀況,存在聲音合成字典的制作效率降低的問題。
發明內容
本實施方式目的是提供提高聲音合成字典的制作效率的合成字典制作裝置。
根據實施方式,合成字典制作裝置具備提示單元、錄制單元、要否判斷單元、字典制作單元和聲音合成單元。提示單元向用戶提示從句子存儲單元所存儲的N個(N是自然數,N≥2)句子依次選擇的第1句子(語句)。錄制單元將朗讀上述第1句子的用戶的聲音錄制,將該錄制波形與上述第1句子相關聯存儲。要否判斷單元,在上述錄制單元中存儲M個(M是自然數,1≤M<N)上述第1句子的錄制波形的狀態下,判斷要否制作聲音合成字典。字典制作單元,在判斷需要聲音合成字典的制作的場合,制作聲音合成字典。聲音合成單元,采用由上述字典制作單元制作的聲音合成字典,將第2句子變換為合成波形。
根據本實施方式,可提供聲音合成字典的制作效率提高的合成字典制作裝置。
附圖說明
圖1是第1實施方式的合成字典制作裝置的方框圖。
圖2是實施方式的合成字典制作裝置的硬件構成的示圖。
圖3是實施方式的合成字典制作裝置的流程圖。
圖4是實施方式的合成字典制作裝置的接口的示圖。
圖5是第2實施方式的合成字典制作裝置的方框圖。
具體實施方式
以下,參照附圖說明本發明的實施方式。
(第1實施方式)
第1實施方式的合成字典制作裝置是將朗讀句子的用戶的聲音錄制,使用該錄制波形制作用戶定制的聲音合成字典的裝置。通過利用由本裝置制作的聲音合成字典的聲音合成,用戶可以自身的音質朗讀任意的句子。
圖1是第1實施方式的合成字典制作裝置100的方框圖。本實施方式的合成字典制作裝置具備:存儲預定的N個(N是自然數,N≥2)句子的句子存儲部109;向用戶提示從句子存儲部109存儲的N個句子依次選擇的第1句子的提示部110;將朗讀第1句子的用戶的聲音錄制,將該錄制波形與第1句子相關聯存儲的錄制部101;根據第1句子和其錄制波形提取特征量的特征提取部102;存儲提取的特征量的特征量存儲部103;判斷要否制作聲音合成字典的要否判斷部104;在要否判斷部104判斷需要聲音合成字典的制作的場合,用特征量制作聲音合成字典的字典制作部105;存儲制作的聲音合成字典的字典存儲部106;用聲音合成字典將第2句子變換為合成波形的聲音合成部107;和評價合成波形的音質的音質評價部108。
這里,要否判斷部104在錄制部101中存儲了M個(M是自然數,1≤M<N)第1句子的錄制波形的狀態下,即,預定的N個句子的朗讀聲音的錄制未結束的狀態下,根據來自用戶的聲音合成字典的制作指示、上述變量M、錄制部101存儲的全部錄制波形的數據量的至少一個,判斷要否制作聲音合成字典。
另外,合成字典制作裝置100在音質評價部108中評價合成波形的音質沒有問題的場合,停止提示部110中第1句子的提示,停止錄制部101中聲音的錄制。
這樣,本實施方式的合成字典制作裝置根據要否制作聲音合成字典的判斷結果,即使在錄制的中途階段,也可用迄今為止存儲的錄制波形和與其相關聯的第1句子制作聲音合成字典。從而,用戶可以在全部朗讀預定的N個句子前,確認聲音合成字典生成的合成波形的音質。
另外,本實施方式的合成字典制作裝置在音質評價部108中評價合成波形的音質沒有問題的場合,停止用戶的聲音的錄制。從而,可以避免用戶朗讀必要以上的句子,提高聲音合成字典的制作效率。
(硬件構成)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210058572.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種翻蓋式下水器
- 下一篇:水電站廠房墻體與板梁分期澆筑的連接方法及結構





