[發明專利]自適應文本轉話音輸出有效
| 申請號: | 201680080197.1 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN108604446B | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 馬修·謝里菲;雅各布·尼古勞斯·弗爾斯特 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G06F40/289;G06F40/253 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自適應 文本 話音 輸出 | ||
在一些實施方式中,由一個或多個計算機確定客戶端設備的用戶的語言熟練度。然后,一個或多個計算機基于用戶的所確定的語言熟練度來確定用于由文本轉話音模塊輸出的文本片段。在確定用于輸出的文本片段之后,一個或多個計算機生成包括文本片段的合成話語的音頻數據。然后,將包括文本片段的合成話語的音頻數據提供給客戶端設備以用于輸出。通過更好的文本轉話音轉換而提供改善的用戶接口。
相關申請的交叉引用
本申請要求于2016年1月28日提交、名稱為“ADAPTIVE?TEXT-TO-SPEECH-OUTPUTS(自適應文本到話音輸出)”的美國申請序列號15/009,432的優先權,其全部內容通過引用并入本文。
技術領域
本說明書總體上涉及電子通信。
背景技術
話音合成指代人工制作人類話音。話音合成器能夠在軟件或硬件組件中實現,以生成對應于文本的話音輸出。譬如,文本轉話音(TTS)系統通常通過串接數據庫中存儲的錄制話音段而將正常的語言文本轉換成話音。
發明內容
隨著電子計算中的更大部分已經從桌面轉移到移動環境,話音合成對于用戶體驗而言變得愈加重要。例如,不帶顯示器的較小移動設備的使用率增長導致了使用文本轉話音(TTS)系統來訪問和使用移動設備上顯示的內容日益增多。
本說明書公開了改進的用戶接口,特別是通過改進的TTS來增強計算機到用戶的通信。
現有TTS系統的一個特殊問題是,這樣的系統往往無法適應不同用戶的不同語言熟練度。這種靈活性欠缺往往會妨礙語言熟練度有限的用戶理解復雜的文本轉話音輸出。譬如,使用TTS系統的非母語說話者可能由于他們的語言熟練度有限而難以理解文本轉話音輸出。現有TTS系統的另一個問題是,用戶理解文本轉話音輸出的即時能力也可能隨特定的用戶場境(context)而變化。譬如,一些用戶場境包括背景噪聲,這可能會使其愈加難以理解更長或更復雜的文本轉話音輸出。
在一些實施方式中,系統基于用戶的語言熟練度來調整用于文本轉話音輸出的文本,以提高用戶能夠領會文本轉話音輸出的可能性。譬如,能夠從在先用戶活動推斷用戶的語言熟練度,并且將其用于將文本轉話音輸出調整成與用戶的語言熟練度相稱的適當復雜度。在一些示例中,系統獲得多個候選文本片段,它們對應于不同水平的語言熟練度。然后,該系統選擇與用戶的語言熟練度最匹配且最密切對應的候選文本片段,并且提供所選文本片段的合成話語以供輸出給用戶。在其他示例中,系統在生成文本轉話音輸出之前將文本片段中的文本更改成更好地對應于用戶的語言熟練度。能夠調整文本片段的各個方面,包括詞匯表、語句結構、長度等。然后,該系統提供更改后的文本片段的合成話語以供輸出給用戶。
針對本文討論的系統收集關于用戶的個人信息或者可以利用個人信息的情形,可以向用戶提供機會來控制程序或特征是否收集個人信息(例如,關于用戶社交網絡、社交動作或活動、職業、用戶偏好、或用戶當前位置的信息),或者控制是否和/或如何從內容服務器接收可能與用戶更相關的內容。此外,在存儲或使用某些數據之前可以通過一種或多種方式將其匿名化,使得移除個人可識別信息。例如,用戶的身份可以被匿名化,使得無法確定用戶的個人可識別信息,或者在獲得位置信息的情況下可以將用戶的地理位置泛化(諸如到城市、郵政編碼或州層級),使得無法確定用戶的特定位置。因此,用戶可以控制如何收集關于他或她的信息以及如何供內容服務器使用該信息。
在一方面,一種計算機實現的方法能夠包括:由一個或多個計算機確定客戶端設備的用戶的語言熟練度;由所述一個或多個計算機基于所述用戶的所確定的語言熟練度來確定供文本轉話音模塊輸出的文本片段;由所述一個或多個計算機生成包括所述文本片段的合成話語的音頻數據;以及由所述一個或多個計算機向所述客戶端設備提供包括所述文本片段的所述合成話語的所述音頻數據。
其他版本包括對應的系統和計算機程序,其被配置成執行計算機存儲設備上編碼的方法的動作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680080197.1/2.html,轉載請聲明來源鉆瓜專利網。





