[發明專利]一種實現音頻處理的方法及裝置有效
| 申請號: | 201710579857.7 | 申請日: | 2017-07-17 |
| 公開(公告)號: | CN107393556B | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 金海嵐;曹磊;任妍;王子鋒 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L13/08;G10L25/03;G10L25/18;G10L25/24;G06K9/00;G09B5/04 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 林桐苒;李丹 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實現 音頻 處理 方法 裝置 | ||
1.一種實現音頻處理的方法,包括:
根據嬰幼兒的聲波信號,確定對早教內容進行音頻播放的語音信號;
在嬰幼兒處于清醒活動狀態時,根據確定的語音信號進行早教內容的音頻播放。
2.根據權利要求1所述的方法,其特征在于,所述根據確定的語音信號進行早教內容的音頻播放之前,該方法還包括:
根據預設的攝像頭獲取實時圖像信息,以確定嬰幼兒是否睜開眼睛;通過預設的音頻傳感器獲取實時音頻信息,以確定嬰幼兒是否哭鬧;
確定嬰幼兒睜開眼睛且未哭鬧時,確定嬰幼兒處于所述清醒活動狀態。
3.根據權利要求1或2所述的方法,其特征在于,所述確定對早教內容進行音頻播放的語音信號包括:
采用原始音頻波形深度生成模型對所述聲波信號進行處理,生成所述對早教內容進行音頻播放的語音信號;或,
獲取所述聲波信號的特征參數,根據獲取的所述特征參數合成所述對早教內容進行音頻播放的語音信號;或,
根據所述聲波信號,從預設的音頻數據庫中根據相似性度量匹配并選擇出所述對早教內容進行音頻播放的語音信號。
4.根據權利要求3所述的方法,其特征在于,所述特征參數包括以下部分或全部參數:音量強度曲線、基頻軌跡、梅爾倒譜參數。
5.根據權利要求3所述的方法,其特征在于,所述預設的音頻數據庫包括:存儲有與所述嬰幼兒年齡在預設時間差值內、體重在預設重量差值內、性別相同、和/或第一語言相同的語音信號的數據庫。
6.根據權利要求1或2所述的方法,其特征在于,所述根據確定的語音信號進行早教內容的音頻播放包括:
所述早教內容為文本文件時,將文本文件根據所述確定的語音信號轉換為音頻文件后播放;
所述早教內容為音頻文件時,將音頻文件中的原始語音信號替換為所述確定的語音信號后播放。
7.一種實現音頻處理的裝置,包括:信號確定單元和播放單元;其中,
信號確定單元用于:根據嬰幼兒的聲波信號,確定對早教內容進行音頻播放的語音信號;
播放單元用于:在嬰幼兒處于清醒活動狀態時,根據確定的語音信號進行早教內容的音頻播放。
8.根據權利要求7所述的裝置,其特征在于,所述裝置還包括狀態確定單元,用于:
根據預設的攝像頭獲取實時圖像信息,以確定嬰幼兒是否睜開眼睛;通過預設的音頻傳感器獲取實時音頻信息,以確定嬰幼兒是否哭鬧;
確定嬰幼兒睜開眼睛且未哭鬧時,確定嬰幼兒處于所述清醒活動狀態。
9.根據權利要求7或8所述的裝置,其特征在于,所述信號確定單元具體用于:
采用原始音頻波形深度生成模型對所述聲波信號進行處理,生成所述對早教內容進行音頻播放的語音信號;或,
獲取所述聲波信號的特征參數,根據獲取的所述特征參數合成所述對早教內容進行音頻播放的語音信號;或,
根據所述聲波信號,從預設的音頻數據庫中根據相似性度量匹配并選擇出所述對早教內容進行音頻播放的語音信號。
10.根據權利要求7或8所述的裝置,其特征在于,所述播放單元具體用于:在嬰幼兒處于清醒活動狀態時,
如果所述早教內容為文本文件,將文本文件根據所述確定的語音信號轉換為音頻文件后播放;
如果所述早教內容為音頻文件,將音頻文件中的原始語音信號替換為所述確定的語音信號后播放。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710579857.7/1.html,轉載請聲明來源鉆瓜專利網。





