[發明專利]聲音合成設備、聲音處理設備和聲音合成方法有效
| 申請號: | 201210320511.2 | 申請日: | 2012-08-31 |
| 公開(公告)號: | CN103295569A | 公開(公告)日: | 2013-09-11 |
| 發明(設計)人: | 嘉山啟 | 申請(專利權)人: | 雅馬哈株式會社 |
| 主分類號: | G10K15/12 | 分類號: | G10K15/12 |
| 代理公司: | 北京天昊聯合知識產權代理有限公司 11112 | 代理人: | 陳源;李銘 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音 合成 設備 處理 方法 | ||
技術領域
本發明涉及使用聲音片段合成聲音(語音或歌聲)的技術。
背景技術
已經提出了片段連接型聲音合成,其中通過連接多個預先提取的聲音波形來生成指定為聲音合成目標的聲音(下文中稱作“要合成的聲音”)。例如,根據JP-A-2007-240564的技術,針對每個聲音片段將預先提取的聲音波形(片段數據)存儲在存儲裝置中,從存儲裝置中連續選擇與要合成的聲音的語音文字(如歌詞)相對應的聲音波形并將其連接在一起來生成要合成的聲音的聲音信號。
根據JP-A-2007-240564的技術,當把超過存儲裝置中存儲的聲音波形的時間長度指定為要合成的聲音的持續時間時,重復(循環)該聲音波形以生成聲音信號。因此,會造成以該聲音波形的時間長度為周期出現規律的特征變化(例如幅度或周期的改變)的問題,而這會使得聽者感受到的聲音質量下降。盡管通過對每個聲音波形確保足夠的時間長度以使其不必重復該聲音波形可以解決上述問題,但長時間存儲該聲音波形需要巨大的存儲容量。
發明內容
有鑒于這些情況,本發明的一個目的是在降低聲音合成所需的存儲容量的同時避免由于聲音波形的重復所導致的聲音質量下降。此外,本發明的另一個目的是實現一種能夠避免聲音質量劣化從而降低聲音合成所需的聲音波形的數據量的聲音合成處理,所述聲音質量的劣化是由用于生成聲音信號的聲音波形的重復而導致的。
下面描述本發明為了解決上述問題而采用的手段。
(1)提供了一種聲音合成設備,包括:
波形存儲部分,其配置為對從表示有聲音的聲音波形在時間軸上的不同位置處提取的多個單元波形進行存儲;和
波形生成部分,其配置為通過在時間軸上排列所述多個單元波形來生成合成波形。
(2)例如,波形生成部分配置為針對多個處理周期的每一個生成合成波形,所述合成波形是第一波形序列和第二波形序列之和,其中在所述第一波形序列中將從多個單元波形中選擇的多個第一單元波形排列為使其強度在處理周期中隨時間而增加,在所述第二波形序列中將從多個單元波形中選擇的且與第一單元波形不同的多個第二單元波形排列為使其強度在處理周期中隨時間而降低。
(3)例如,所述多個單元波形中的每一個都對應于聲音波形的一個周期。
(4)例如,多個單元波形具有共同的峰-峰值。
(5)例如,多個單元波形具有共同的時間長度。
(6)例如,多個單元波形具有調節為使得這些單元波形之間的互相關函數最高的相位。
(7)例如,多個處理周期中的一個處理周期中的第一單元波形與該多個處理周期中緊靠所述一個處理周期之后的一個處理周期中的第二單元波形是共同的單元波形。
(8)例如,波形生成部分配置為針對每個處理周期從所述多個單元波形中隨機選擇第一單元波形。
(9)例如,波形生成部分配置為將所述多個處理周期的時間長度設置為使得所述多個處理周期中的一個處理周期的時間長度和所述多個處理周期中的另一個處理周期的時間長度彼此不同。
(10)例如,波形生成部分配置為隨機設置所述多個處理周期中每一個的時間長度。
(11)還提供了用于生成用在聲音合成設備中的多個單元波形的聲音處理設備,所述聲音處理設備包括:
波形提取部分,其配置為從表示有聲音的聲音波形在時間軸上的不同位置處提取多個單元波形;和
波形校正部分,其配置為對通過波形提取部分提取的多個單元波形進行校正,從而使得各單元波形的聲學特征彼此接近。
(12)例如,波形校正部分包括周期校正部分,所述周期校正部分配置為將所述多個單元波形的時間長度校正為共同的預定長度。
(13)例如,周期校正部分包括:指標計算部分,其配置為針對彼此不同的多個備選長度中的每一個來計算失真指標值,所述失真指標值表示當所述多個單元波形中的每一個擴展或壓縮至時間軸上的備選長度時所述多個單元波形中的每一個的失真度;和校正處理部分,其配置為從所述多個備選長度中選擇具有表示最小失真度的失真指標值的備選長度來作為共同預定長度,并且將所述多個單元波形的時間長度調節為所述共同預定長度。
(14)例如,聲音處理部分還包括失真校正部分,其配置為針對波形提取部分所提取的多個單元波形的時間長度,對所述多個單元波形的幅度進行校正,以使其幅度根據共同預定長度的長度而增加。
(15)提供了一種聲音合成方法,包括:
對從表示有聲音的聲音波形在時間軸上的不同位置處提取的多個單元波形進行存儲;和
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于雅馬哈株式會社,未經雅馬哈株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210320511.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:熱室
- 下一篇:保險柜系統、保險柜裝置及其控制方法





