[發明專利]一種快速實現語音交互功能的系統在審
| 申請號: | 202010779872.8 | 申請日: | 2020-08-05 |
| 公開(公告)號: | CN111857646A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 劉重凱;李旭濱 | 申請(專利權)人: | 上海茂聲智能科技有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16;G10L15/22;G10L13/02 |
| 代理公司: | 上海領譽知識產權代理有限公司 31383 | 代理人: | 車超平;王琰 |
| 地址: | 201306 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 快速 實現 語音 交互 功能 系統 | ||
1.一種快速實現語音交互功能的系統,應用于安卓設備,其特征在于,包括:
I2S標準麥克風陣列,用于采集用戶的第一模擬語音數據;
語音轉換單元,用于將所述第一模擬語音數據轉換為第一數字語音數據,以及將第二數字語音數據轉換為第二模擬語音數據;
語音處理單元,用于對所述第一數字語音數據進行全鏈路語音處理,以生成與所述第一數字語音數據相對應的所述第二數字語音數據,其中,所述語音處理單元獨立運行于所述安卓設備的操作系統,所述全鏈路語音處理包括語音識別、語義理解、對話管理、自然語言生成以及文本轉語音;
I2S標準播放器,用于播放所述第二模擬語音數據。
2.根據權利要求1所述的系統,其特征在于,還包括:
I2S標準接口,用于接收所述I2S標準麥克風陣列發送的所述第一模擬語音數據、并將所述第一模擬語音數據發送到所述語音轉換單元,以及接收所述語音轉換單元發送的所述第二模擬語音數據、并將所述第二模擬語音數據發送到所述I2S標準播放器。
3.根據權利要求1所述的系統,其特征在于,所述語音處理單元包括:
語音識別模塊,用于識別所述第一數字語音數據以獲取用戶意圖,并將所述用戶意圖發送到所述安卓設備的應用層,其中,所述語音識別模塊具有可移植性,能夠使所述語音處理單元運行在若干種處理器架構上。
4.根據權利要求3所述的系統,其特征在于,所述語音處理單元還包括:
語音合成模塊,用于在所述安卓設備的應用層生成與所述用戶意圖相對應的執行動作的執行動作結果的情況下,根據所述執行動作結果合成所述第二數字語音數據。
5.根據權利要求1所述的系統,其特征在于,所述語音處理單元還包括:
配置模塊,用于配置所述I2S標準麥克風陣列的參數。
6.根據權利要求1所述的系統,其特征在于,還包括:
JNI標準動態鏈接庫,用于接收所述語音轉換單元發送的所述第一數字語音數據,并將所述第一數字語音數據發送到所述語音處理單元。
7.根據權利要求1所述的系統,其特征在于,所述語音處理單元還包括:
通信接口,用于與所述安卓設備的應用層進行進程間通信。
8.根據權利要求7所述的系統,其特征在于,所述通信接口包括:
調用接口,用于調用所述語音處理單元執行與所述第一數字語音數據相對應的執行動作。
9.根據權利要求8所述的系統,其特征在于,所述通信接口還包括:
事件通報接口,用于向所述安卓設備的應用層通報執行結果。
10.根據權利要求1所述的系統,其特征在于,所述語音轉換單元可以為Tinyalsa音頻驅動。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海茂聲智能科技有限公司,未經上海茂聲智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010779872.8/1.html,轉載請聲明來源鉆瓜專利網。





