[發明專利]一種智能兒童玩具的語音處理系統在審
| 申請號: | 201811267105.8 | 申請日: | 2018-10-29 |
| 公開(公告)號: | CN109346057A | 公開(公告)日: | 2019-02-15 |
| 發明(設計)人: | 熊寬 | 申請(專利權)人: | 深圳市友杰智新科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L15/22;G10L17/00;G10L17/04 |
| 代理公司: | 深圳市深科信知識產權代理事務所(普通合伙) 44422 | 代理人: | 彭光榮 |
| 地址: | 518000 廣東省深圳市南山區招商*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋 處理模型 語音處理系統 多媒體文件 兒童玩具 語音文件 麥克風 處理器 服務器 幼兒 存儲 錄音 揚聲器 語音合成技術 處理器連接 服務器連接 揚聲器連接 用戶需求 語音指令 智能 自定義 調出 陪護 預設 錄制 播放 閱讀 家長 重復 | ||
本發明公開了一種智能兒童玩具的語音處理系統,包括設備麥克風、聲紋處理模型、本地存儲、處理器、服務器和揚聲器;所述設備麥克風分別與聲紋處理模型、處理器連接;所述本地存儲分別與聲紋處理模型、服務器連接;所述服務器分別與處理器、揚聲器連接;本發明不需要對每一個多媒體文件都進行錄音,只需要錄制預設的語音文件進行提前聲紋;通過聲紋提取,語音合成技術,用戶對著設備說出語音指令就可以調出帶有自定義聲紋的語音文件進行播放;減少對多媒體文件重復錄音,方便用戶需求,且增加趣味性,提高用戶的閱讀體驗,建立了家長和幼兒的密切聯系,更加貼切地實現了幼兒的早教與陪護。
技術領域
本發明涉及語音處理技術領域,具體涉及一種智能兒童玩具的語音處理系統。
背景技術
現有的語音處理系統需要與服務器、終端之間進行配合:終端可以為父母使用的手機,則父母通過終端選擇需要播放的文件進行錄音后,上傳到服務器,由服務器將該音頻文件文件的訪問地址發送至兒童故事機,并使得兒童故事機通過該訪問地址實現音頻文件的數據獲取和播放。
CN107749296A提供一種語音翻譯方法和裝置,此發明實施例所提供的一種語音翻譯方法,通過從原始語音信息中提取出原始聲紋,再將翻譯信息和原始聲紋合成為最終語音信息,使得最終語音信息與原始語音信息的聲紋相同,聽起來好像對方用戶自己說出了翻譯后的語言,實現了原聲翻譯的效果,將人機對話提升為人與人的直接對話,提高了翻譯語音的生動性和真實性。
可見現有的語音處理系統需要對每一個多媒體文件進行錄音,這樣不太方便。
發明內容
有鑒于此,為了解決現有技術中的上述問題,本發明提出一種智能兒童玩具的語音處理系統,通過聲紋識別算法模型提取聲紋特征,對進行多媒體文件語音合成的智能兒童玩具的語音處理方法,方便用戶需求,且增加趣味性,提高用戶的閱讀體驗,建立了家長和幼兒的密切聯系,更加貼切地實現了幼兒的早教與陪護。
本發明通過以下技術手段解決上述問題:
一種智能兒童玩具的語音處理系統,包括設備麥克風、聲紋處理模型、本地存儲、處理器、服務器和揚聲器;
所述設備麥克風分別與聲紋處理模型、處理器連接;
所述本地存儲分別與聲紋處理模型、服務器連接;
所述服務器分別與處理器、揚聲器連接;
通過軟件對系統預設一個語音文本,當用戶開啟或連接系統時,系統發送一個語音文本信息給用戶,用戶對著設備麥克風讀出此文本,錄制一段語音;設備麥克風接收到錄制的語音信息后,應用預先訓練的聲紋識別模型提取語音信息的聲紋特征,進行分類標識,標上對應的角色關鍵詞;將標識好的聲紋上傳到本地存儲;用戶對著設備麥克風輸出關鍵詞的語音指令,并上傳到處理器;處理器將接收到的語音指令進行語音識別,并傳送給服務器;服務器將接收到語音信息,找到所要播放的音頻文件并且通過聲紋識別的模型進行剔除預設的聲紋,得到無聲紋的目標語音信息,得到無聲紋的目標語音信息后,將本地存儲內對應標識好的聲紋進行合成,得到最終語音信息,并發送給揚聲器進行播放。
進一步地,分類標識具體為:當用戶錄制的語音通過聲紋識別模型進行相應的算法處理完成后,用戶就會收到系統發送的通知選擇對應的角色關鍵詞,如:爸爸、媽媽、爺爺或奶奶,用于選擇對應的關鍵詞進行分類標識。
與現有技術相比,本發明的有益效果至少包括:
1、不需要對每一個多媒體文件都進行錄音,只需要錄制預設的語音文件進行提前聲紋;
2、通過聲紋提取,語音合成技術,用戶對著設備說出語音指令就可以調出帶有自定義聲紋的語音文件進行播放;
3、減少對多媒體文件重復錄音,方便用戶需求,且增加趣味性,提高用戶的閱讀體驗,建立了家長和幼兒的密切聯系,更加貼切地實現了幼兒的早教與陪護。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市友杰智新科技有限公司,未經深圳市友杰智新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811267105.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于深度度量網絡的語音合成方法及裝置
- 下一篇:一種語音聲學特征擴大系統





