[發明專利]語音處理方法、信息裝置與計算機程序產品在審
| 申請號: | 201810988537.1 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN110867191A | 公開(公告)日: | 2020-03-06 |
| 發明(設計)人: | 許云旭;陳柏儒 | 申請(專利權)人: | 洞見未來科技股份有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0272;G10L25/51;H04L29/08 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 梁麗超;田喜慶 |
| 地址: | 薩摩亞*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 信息 裝置 計算機 程序 產品 | ||
1.一種計算機執行的語音處理方法,涉及一生成對抗網絡,該生成對抗網絡包含一個生成網絡與一個判別網絡,其中該方法包含:
(a)通過一麥克風取得一混合語音信號,其中該混合語音信號至少包含多個說話人在一時段內發出的多個語音信號;
(b)提供該混合語音信號給該生成網絡,該生成網絡以一生成模型來根據該混合語音信號加以產出一組模擬語音信號,以模擬該多個語音信號,其中該生成模型中的參數由該生成網絡與該判別網絡不斷對抗學習而決定;以及
(c)決定該組模擬語音信號的信號數目,并提供作為一信息應用程序的輸入。
2.如權利要求1所述的方法,其中該多個說話人所發出的多個語音信號并無作為樣本預先提供給該生成對抗網絡。
3.如權利要求1所述的方法,還包含:
利用該組模擬語音信號的信號數目,辨識該多個說話人所發出的多個語音信號的聲紋。
4.如權利要求1所述的方法,其中根據一預定時間表或條件,重復步驟(a)至(c),以提供多個輸入給該信息應用程序,由此該信息應用程序根據該多個輸入以執行一特定應用。
5.一種計算機執行的語音處理方法,其中該方法包含:
(a)通過一麥克風取得一混合語音信號,其中該混合語音信號至少包含多個說話人在一時段內所發出的多個語音信號;
(b)根據該混合語音信號加以產出一組模擬語音信號,以模擬該多個語音信號,其中該多個說話人所發出的多個語音信號并無作為樣本預先提供;以及
(c)決定該組模擬語音信號的信號數目,并提供作為一信息應用程序的輸入。
6.一種儲存在一計算機可用介質上的計算機程序產品,包含一計算機可讀程序,供于一信息裝置上執行時,以執行如權利要求1至5中任一項所述的方法。
7.一種信息裝置,包含:
一處理器,用以執行一音頻處理程序以及一信息應用程序;
一麥克風,用以接收一混合語音信號,其中該混合語音信號至少包含多個說話人所同時發出的多個語音信號;
其中該處理器執行該音頻處理程序,以執行如權利要求1至5中任一項所述的方法。
8.如權利要求7所述的信息裝置,其中該麥克風還以單聲道接收該混合語音信號。
9.如權利要求7所述的信息裝置,其中該信息應用程序根據該組模擬語音信號的信號數目,判斷該信息裝置所處環境的環境特性。
10.如權利要求7所述的信息裝置,其中該信息應用程序根據該組模擬語音信號的信號數目,判斷該信息裝置所處環境中說話人的行為。
11.如權利要求7所述的信息裝置,其中該信息應用程序根據該組模擬語音信號的信號數目決定存取特定的多媒體數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于洞見未來科技股份有限公司,未經洞見未來科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810988537.1/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





