[發明專利]針對多種語言處理內容的語音合成有效
| 申請號: | 201380017905.3 | 申請日: | 2013-03-04 |
| 公開(公告)號: | CN104380284B | 公開(公告)日: | 2018-01-30 |
| 發明(設計)人: | C·B·弗雷扎齊;D·C·米尼菲 | 申請(專利權)人: | 蘋果公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G10L13/033 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所11038 | 代理人: | 鮑進 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 多種 語言 處理 內容 語音 合成 | ||
背景技術
本發明所公開的實施例整體涉及文本到語音合成,并且更具體地涉及允許用戶從多種語言中選擇要用于執行文本到語音合成或轉換的語言的技術。
語言文本轉換成語音的過程通常稱為文本到語音合成或文本到語音轉換。由于人類所說語言的多樣性,各種語言可用于執行文本到語音轉換。能夠以多種語言執行文本到語音轉換的系統通常提供多種語言合成器,每個語言合成器被配置為以特定語言將文本轉換成語音。例如,英語語言合成器可提供用于將文本轉換成英語語音,法語語言合成器可提供用于將文本轉換成法語語音,日語語言合成器可提供用于將文本轉換成日語語音等等。取決于要用于語音的特定語言,對應于特定語言的語言合成器被用于執行文本到語音轉換。
對于共用字符的語言(諸如英語、法語和德語)來說,同一段文本可使用對應于這些語言的合成器中的任何合成器來轉換成語音。然而,因為用于特定語言的合成器使用特定于該語言的讀音規則和發音,所以對于不同合成器來說,同一段文本的語音輸出聽起來將有所不同。例如,從使用英語合成器對一段文本進行文本到語音轉換得到的語音聽起來可能與從使用法語合成器對同一段文本進行文本到語音轉換得到的語音非常不同。
在常規系統中,一般自動選擇默認語言合成器來執行文本到語音轉換,只要默認合成器可輸出正在轉換的文本的語音即可。然而,這可能產生用戶不期望的語音結果。例如,如果要轉換的文本是法語語言并且英語語言合成器是默認合成器,那么輸出可能是以嚴重英語口音說出的法語。
發明內容
描述了允許用戶從多種語言中選擇要用于執行文本到語音轉換的語言的某些實施例。
在一些實施例中,可將多種語言顯示給用戶。用戶可隨后從多種語言中選擇要使用的特定語言。用戶選擇的語言可隨后用于產生要轉換成語音的文本的語音。
在一些實施例中,在確定可適于執行文本的一部分的文本到語音轉換的多種語言時,可將該多種語言顯示給用戶。用戶可隨后從多種語言中選擇要使用的特定語言。當產生文本的語音時,可以用戶選擇的語言將文本的該部分轉換成語音。
在一些實施例中,使用一個或多個分析準則來分析要轉換成語音的文本?;诜治?,可將一種或多種語言確定為可適用于將文本轉換成語音。在一些情況下,分析可產生適用于文本的相同部分的多種語言。在這種情景下,可將多種語言輸出給用戶。用戶可隨后從多種語言中選擇特定語言。隨后使用對應于用戶選擇的語言的語言合成器,以用戶選擇的語言將文本的該部分轉換成語音。
文本的該部分(可針對文本的該部分將多種語言識別為可能的候選語言)可以是要轉換成語音的整個文本或該文本的子集。文本的子集可以是例如但不限于文本內的一個或多個字符、文本內的一個或多個詞、文本內的一個或多個句子等等。
在一些實施例中,用以識別要用于將文本轉換成語音的一種或多種語言的對文本的分析可基于各種準則。準則的例子可包括但不限于:一個或多個加載的鍵盤、與文本相關聯的一個或多個標簽、在分析要轉換成語音的文本時由語言分析工具識別的一種或多種語言、專用數據(例如,托管網頁的網站的域信息、即時消息應用程序的發送方電話號碼)、與文本中的一個或多個字符相關聯的字符編碼信息(例如Unicode信息)、一個或多個用戶偏好(例如,語言或場所偏好)、用戶歷史信息(例如,用于文本到語音轉換的先前用戶語言選擇)、文本的來源、與文本相關聯的國家代碼頂級域信息、全球定位系統(GPS)信息(例如,識別用戶或用戶設備的位置)等等。這些準則的各種組合用于各種實施例,以便識別要用于將文本轉換成語音的一種或多種語言。
在一些實施例中,對包括多種語言的文本來說,用于執行文本到語音轉換的語言合成器自動地針對不同語言進行切換。在一些實施例中,可逐字符地處理文本并且確定要用于將字符轉換成語音的語言。可識別要轉換成語音的文本中的字符范圍,每一個范圍與一種語言相關聯。當將文本轉換成語音時,每一個范圍部分是使用對應于與該范圍相關聯的語言的語言合成器來轉換成語音。這允許語言合成器在文本到語音轉換期間自動地切換,以便促進文本到語音的轉換。
在一些實施例中,文本到語音轉換可提供為基于web的服務或云服務,或可在軟件即服務(Software as a Service,SaaS)模型下提供。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘋果公司,未經蘋果公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380017905.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高性能互連相干協議
- 下一篇:一種用于傳聲器風噪聲抑制的裝置





