[發明專利]動態的文本到語音供應有效
| 申請號: | 201780067743.2 | 申請日: | 2017-07-13 |
| 公開(公告)號: | CN109891497B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | J.J.S.奧坎波 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G10L13/033 | 分類號: | G10L13/033;G10L15/22;G10L25/48;G10L25/63;G10L21/0364 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 金玉潔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 動態 文本 語音 供應 | ||
1.一種計算機實施的方法,包括:
由一個或多個計算設備基于以下各項來確定一個或多個用戶屬性:(i)與用戶設備相關聯的用戶的語音特征、以及(ii)指示用戶與用戶設備之間的距離的接近度指示符;
由所述一個或多個計算設備獲得要輸出的數據;
由所述一個或多個計算設備基于所述一個或多個用戶屬性選擇音頻輸出模板;
由所述一個或多個計算設備使用所選擇的音頻輸出模板生成包括所述數據的音頻信號;以及
由所述一個或多個計算設備提供用于輸出的音頻信號,
其中確定指示用戶與用戶設備之間的距離的所述接近度指示符包括:
從第一麥克風獲得音頻信號數據;
從第二麥克風獲得音頻信號數據;以及
基于來自第一麥克風的音頻信號數據的特性和來自第二麥克風的音頻信號數據的特性來確定所述接近度指示符,其中所述確定包括:
將來自所述第一麥克風的音頻信號數據的特性與來自所述第二麥克風的音頻數據的特性進行比較,其中所述用戶與所述用戶設備之間的距離與所述音頻信號的特性之間的差異成反比;
根據比較結果,確定指示所述用戶位于距所述用戶設備大于預定閾值距離的距離處的接近度指示符,或者使用預定閾值距離的標尺,確定指示所述用戶位于距所述用戶設備小于預定閾值距離的標尺之一的距離處的接近度指示符。
2.如權利要求1所述的計算機實施的方法,其中所述與用戶設備相關聯的用戶的語音特征包括與所述用戶相關聯的音頻語音信號中的音高、音調、頻率和振幅中的一個或多個。
3.如權利要求1或權利要求2所述的計算機實施的方法,還包括:
確定環境屬性;以及
基于所確定的環境屬性確定環境的類型,
其中,進一步基于所確定的環境的類型來選擇音頻輸出模板。
4.如權利要求1或權利要求2所述的計算機實施的方法,其中,所選擇的音頻輸出模板包括振幅、頻率、單詞發音和音調數據,以用于配置用于輸出的音頻信號;并且
其中,所選擇的音頻輸出模板包括與所確定的一個或多個用戶屬性匹配的屬性。
5.如權利要求1或權利要求2所述的計算機實施的方法,其中,選擇音頻輸出模板包括進一步基于以下中的一個或多個來選擇音頻輸出模板:(I)要輸出的數據的類型、以及(II)用于提供要輸出的數據的應用的類型。
6.如權利要求1所述的計算機實施的方法,還包括:
由所述一個或多個計算設備接收輸出數據的命令,所述命令包括獲得數據的用戶請求、或來自被編程為在特定時間輸出數據的應用的指令。
7.如權利要求1所述的計算機實施的方法,其中基于指示用戶與用戶設備之間的距離的接近度指示符來確定所述一個或多個用戶屬性包括:
從一個或多個傳感器獲得傳感器數據;以及
基于傳感器數據、來自第一麥克風的音頻信號數據和來自第二麥克風的音頻信號數據來確定用戶的可能位置和可能距離。
8.如權利要求1或權利要求2所述的計算機實施的方法,還包括:
從用戶接收音頻語音信號,
其中,為輸出提供的音頻信號具有與接收的音頻語音信號匹配的音高、音調或振幅。
9.根據權利要求1至8中任一項所述的計算機實施的方法,其中所述第一和第二音頻信號數據的特性是振幅和頻率。
10.一個或多個非暫時性計算機可讀存儲介質,包括指令,當由一個或多個計算設備執行時,所述指令使所述一個或多個計算設備執行權利要求1至9中任一項所述的方法。
11.一種用于語音合成的系統包括:
一個或多個計算設備和存儲指令的一個或多個存儲設備,所述指令在由所述一個或多個計算設備運行時,使所述一個或多個計算設備執行權利要求1至9中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780067743.2/1.html,轉載請聲明來源鉆瓜專利網。





