[發明專利]語音合成裝置、方法、程序、系統以及便攜式信息終端有效
| 申請號: | 200910134594.4 | 申請日: | 2009-04-23 |
| 公開(公告)號: | CN101567186A | 公開(公告)日: | 2009-10-28 |
| 發明(設計)人: | 高塚進 | 申請(專利權)人: | 索尼愛立信移動通信日本株式會社 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04;G10L13/08 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 付建軍 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 裝置 方法 程序 系統 以及 便攜式 信息 終端 | ||
技術領域
本發明涉及一種在將各種效果添加到例如從文本數據轉換成的語音的情況下期望的語音合成裝置、語音合成方法、語音合成程序、便攜式信息終端和語音合成系統。?
背景技術
作為個人計算機或游戲機實現的功能之一,有一種從揚聲器輸出從文本數據轉換成的語音信號的功能。該功能被稱作朗讀功能。?
大致有兩種類型的在該朗讀功能中使用的執行文本到語音轉換的方法。?
這兩種類型的方法中的一種是通過歸檔(filing)和編輯的語音合成,另一種是利用規則的語音合成。?
通過歸檔和編輯的語音合成是一種通過執行編輯來合成期望的詞、句子等的方法,所述編輯諸如為組合預先記錄的語音項目(如人發聲的詞等)。這里,在通過歸檔和編輯的語音合成中,盡管得到的語音聽起來自然并且接近人聲,但是由于通過組合預先記錄的語音項目來產生期望的詞、句子等,所以利用預先記錄的語音項目無法產生某些詞或句子。而且,例如,當將該通過歸檔和編輯的語音合成應用于若干虛構角色朗讀文本的情況時,需要與虛構角色的數量一樣多的多組不同音質(聲色)的語音數據。具體地講,對于高質量的音質,例如,每個虛構角色需要600MB的附加語音數據。?
相反,利用規則的語音合成是一種通過組合諸如構成語音的“音素”和“音節”的元素來合成語音的方法。由于諸如“音素”和“音節”的元素可被自由地組合,所以這種利用規則的語音合成的自由度高。而且,例如,由于不需要預先記錄語音數據作為材料,所以這種利用規?則的語音合成適合安裝在內置存儲器不足夠大的裝置(如便攜式信息終端)中的應用的語音合成功能。這里,與以上描述的通過歸檔和編輯的語音合成相比,通過利用規則的語音合成獲得的合成語音更像機器聲音的語音。?
另外,例如,第2001-51688號未審查日本專利申請公報公開了一種利用語音合成的電子郵件朗讀裝置,在所述語音合成中,利用關于電子郵件消息的文本信息來合成與電子郵件消息的文本對應的語音,將音樂和聲效添加到合成語音中,然后輸出得到的合成語音。?
另外,例如,第2002-354111號未審查日本專利申請公報公開了一種語音信號合成裝置等,其合成從麥克風輸入的語音和從背景音樂(BGM)記錄單元再現的BGM,并從揚聲器等輸出得到的語音信號。?
另外,例如,第2005-106905號未審查日本專利申請公報公開了一種語音輸出系統等,其將包括在電子郵件消息或網站中的文本數據轉換成語音數據,將所述語音數據轉換成語音信號,并從揚聲器等輸出所述語音信號。?
另外,例如,第2003-223181號未審查日本專利申請公報公開了一種文本到語音轉換裝置等,其將文本數據劃分成象形文字數據和其它文字數據,將象形文字數據轉換成聲調控制數據,基于聲調控制數據將其它文字數據轉換成具有聲調的語音信號,并從揚聲器等輸出語音信號。?
另外,第2007-293277號未審查日本專利申請公報公開了一種從RSS內容提取文本并將該文本轉換成語音的RSS內容管理方法等。?
發明內容
這里,在用于執行文本到語音轉換的上述現有技術中,文本數據僅被轉換成語音信號,并且所述語音信號僅被再現。因此,再現輸出的語音信號是像機器聲音的語音并且不具有吸引力。?
例如,通過歸檔和編輯的語音合成提供了聽起來自然并且接近人聲的語音,然而,該語音是通過簡單轉換文本而獲得的,從而該語音?不具有吸引力。此外,利用規則的語音合成的缺點在于語音為像機器聲音的語音并且聽起來差。?
另一方面,如上述的日本未審查專利申請公報所述,存在一種可以通過添加BGM或聲調將一些效果添加到語音的技術,然而,這種添加的效果并不是在每種情況下都對收聽者有益。?
期望提供一種語音合成裝置、語音合成方法、語音合成程序、便攜式信息終端以及語音合成系統,其在例如再現輸出從文本數據轉換成的語音信號的情況下,能夠輸出一種有吸引力的語音,該語音給收聽者一種語音不僅僅是從對象文本轉換而來的愉悅印象。?
此外,期望提供一種語音合成裝置、語音合成方法、語音合成程序、便攜式信息終端以及語音合成系統,其能夠輸出已經添加了對收聽者在一定程度上有益的效果等的再現語音。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼愛立信移動通信日本株式會社,未經索尼愛立信移動通信日本株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910134594.4/2.html,轉載請聲明來源鉆瓜專利網。





