[發(fā)明專利]可加載個性化特征模型的語音識別系統(tǒng)及方法在審

申請?zhí)枺?/td>	201610150095.4	申請日：	2016-03-16
公開（公告）號：	CN107204189A	公開（公告）日：	2017-09-26
發(fā)明（設計）人：	郎立國	申請（專利權）人：	中航華東光電（上海）有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/07
代理公司：	上海宣宜專利代理事務所(普通合伙)31288	代理人：	劉君
地址：	200233 上海市閔行***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	加載個性化特征模型語音識別系統(tǒng) 方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種可加載個性化特征模型的語音識別系統(tǒng)，其特征在于，所述可加載個性化特征模型的語音識別系統(tǒng)包括：

語音編解碼芯片，用于將接收到的模擬語音信號進行A/D轉換得到數字音頻信號，及將數字信號處理器后的數字音頻信號進行D/A轉換為模擬語音信號；

數字信號處理器，用于對輸入的數字音頻信號進行語音識別算法處理，識別完成后將識別的結果語音合成為輸出數字音頻信號，發(fā)送給語音編解碼芯片進行語音輸出；

FLASH芯片，用于存儲數字信號處理器的語音識別程序及通用語音模型數據，上電啟動后，程序及通用語音模型數據從FLASH芯片加載到DDR RAM芯片中；

DDR RAM芯片，用于運行語音識別程序，存儲通用語音模型數據及個性化特征模型數據；

串口芯片，數字信號處理器通過串口芯片和外部通信，通過串口給出識別出的詞匯對應的漢字碼；

網絡芯片，當某人口音特別嚴重時，利用通用語音模型識別時識別率小于95％，用于加載個性化特征模型數據，以提高其識別率。

2.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng)，其特征在于，所述可加載個性化特征模型的語音識別系統(tǒng)還包括鋰電池，鋰電池用于給所述可加載個性化特征模型的語音識別系統(tǒng)供電。

3.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng)，其特征在于，所述數字信號處理器選用高性能低功耗的浮點型TMS320C6748數字信號處理器。

4.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng)，其特征在于，所述語音編解碼芯片需要支持多種采樣率。

5.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng)，其特征在于，所述網絡芯片選擇LAN8710A型芯片。

6.根據權利要求1所述的可加載個性化特征模型的語音識別系統(tǒng)，其特征在于，所述數字信號處理器的通信和語音編解碼芯片的通信都采取DMA方式通信。

7.一種可加載個性化特征模型的語音識別方法，其特征在于，其包括如下步驟：

步驟一，系統(tǒng)上電后，首先將語音識別程序從FLASH芯片加載到DDR RAM芯片中，然后將通用語音模型數據加載到DDR RAM芯片中，開始運行準備語音識別；

步驟二，語音識別模塊上電程序運行后，系統(tǒng)進行識別按鍵檢測，檢測到識別按鍵按下后，開始控制音頻編解碼芯片，進行AD轉換接收語音信號，然后通過語音識別算法進行語音識別，同時系統(tǒng)檢測到識別按鍵抬起后，通過串口給出識別出的詞匯對應的漢字碼，同時將識別的詞匯進行語音合成，控制音頻編解碼芯片將合成的結果DA轉換為模擬語音信號進行輸出；

步驟三，語音識別模塊運行中，如果檢測到模型切換按鍵按下，加載下一條個性化語音模型數據到DDR RAM芯片，如果沒有下一條個性化語音模型數據，加載通用語音模型數據到DDR RAM芯片中，后續(xù)語音識別將會使用新加載的模型進行語音識別；

步驟四，語音識別模塊運行中，如果接收到網絡加載的個性化語音模型數據，則將收到的個性化語音模型數據存儲到FLASH芯片中及DDR RAM芯片中，后續(xù)語音識別將會使用新加載的模型進行語音識別。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中航華東光電（上海）有限公司，未經中航華東光電（上海）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610150095.4/1.html，轉載請聲明來源鉆瓜專利網。