[發(fā)明專利]可加載個性化特征模型的語音識別系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201610150095.4 | 申請日: | 2016-03-16 |
| 公開(公告)號: | CN107204189A | 公開(公告)日: | 2017-09-26 |
| 發(fā)明(設計)人: | 郎立國 | 申請(專利權)人: | 中航華東光電(上海)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/07 |
| 代理公司: | 上海宣宜專利代理事務所(普通合伙)31288 | 代理人: | 劉君 |
| 地址: | 200233 上海市閔行*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 加載 個性化 特征 模型 語音 識別 系統(tǒng) 方法 | ||
1.一種可加載個性化特征模型的語音識別系統(tǒng),其特征在于,所述可加載個性化特征模型的語音識別系統(tǒng)包括:
語音編解碼芯片,用于將接收到的模擬語音信號進行A/D轉換得到數字音頻信號,及將數字信號處理器后的數字音頻信號進行D/A轉換為模擬語音信號;
數字信號處理器,用于對輸入的數字音頻信號進行語音識別算法處理,識別完成后將識別的結果語音合成為輸出數字音頻信號,發(fā)送給語音編解碼芯片進行語音輸出;
FLASH芯片,用于存儲數字信號處理器的語音識別程序及通用語音模型數據,上電啟動后,程序及通用語音模型數據從FLASH芯片加載到DDR RAM芯片中;
DDR RAM芯片,用于運行語音識別程序,存儲通用語音模型數據及個性化特征模型數據;
串口芯片,數字信號處理器通過串口芯片和外部通信,通過串口給出識別出的詞匯對應的漢字碼;
網絡芯片,當某人口音特別嚴重時,利用通用語音模型識別時識別率小于95%,用于加載個性化特征模型數據,以提高其識別率。
2.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng),其特征在于,所述可加載個性化特征模型的語音識別系統(tǒng)還包括鋰電池,鋰電池用于給所述可加載個性化特征模型的語音識別系統(tǒng)供電。
3.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng),其特征在于,所述數字信號處理器選用高性能低功耗的浮點型TMS320C6748數字信號處理器。
4.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng),其特征在于,所述語音編解碼芯片需要支持多種采樣率。
5.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng),其特征在于,所述網絡芯片選擇LAN8710A型芯片。
6.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng),其特征在于,所述數字信號處理器的通信和語音編解碼芯片的通信都采取DMA方 式通信。
7.一種可加載個性化特征模型的語音識別方法,其特征在于,其包括如下步驟:
步驟一,系統(tǒng)上電后,首先將語音識別程序從FLASH芯片加載到DDR RAM芯片中,然后將通用語音模型數據加載到DDR RAM芯片中,開始運行準備語音識別;
步驟二,語音識別模塊上電程序運行后,系統(tǒng)進行識別按鍵檢測,檢測到識別按鍵按下后,開始控制音頻編解碼芯片,進行AD轉換接收語音信號,然后通過語音識別算法進行語音識別,同時系統(tǒng)檢測到識別按鍵抬起后,通過串口給出識別出的詞匯對應的漢字碼,同時將識別的詞匯進行語音合成,控制音頻編解碼芯片將合成的結果DA轉換為模擬語音信號進行輸出;
步驟三,語音識別模塊運行中,如果檢測到模型切換按鍵按下,加載下一條個性化語音模型數據到DDR RAM芯片,如果沒有下一條個性化語音模型數據,加載通用語音模型數據到DDR RAM芯片中,后續(xù)語音識別將會使用新加載的模型進行語音識別;
步驟四,語音識別模塊運行中,如果接收到網絡加載的個性化語音模型數據,則將收到的個性化語音模型數據存儲到FLASH芯片中及DDR RAM芯片中,后續(xù)語音識別將會使用新加載的模型進行語音識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中航華東光電(上海)有限公司,未經中航華東光電(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610150095.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種土壤檢測用樣品儲存箱
- 下一篇:一種具有通風功能的蒲公英存儲裝置





