[發(fā)明專利]基于稀疏矩陣快速語音識別方法和裝置在審
| 申請?zhí)枺?/td> | 201410801905.9 | 申請日: | 2014-12-18 |
| 公開(公告)號: | CN104599668A | 公開(公告)日: | 2015-05-06 |
| 發(fā)明(設計)人: | 王東;劉超;劉榮;鄭方 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稀疏 矩陣 快速 語音 識別 方法 裝置 | ||
1.一種基于稀疏矩陣快速語音識別方法,其特征在于,包括:
獲取深度神經網絡的稀疏矩陣;
對所述稀疏矩陣的行下標和列下標進行編碼,得到編碼數組;
使用遺傳算法對編碼數組按照行或列進行編碼數據元素的隨機轉換,得到多個轉換后的編碼數組,其中,所述遺傳算法包括:選擇算子、交叉算子和變異算子;
使用選擇算子選擇滿足一定標準的多個轉換后的編碼數組;
使用交叉算子處理滿足一定標準的轉換后的編碼數組,得到多個交叉后的編碼數組;
使用變異算子處理所述多個交叉后的編碼數組,得到多個變異后的編碼數組;
使用評價函數計算轉換后的編碼數組對應的稀疏矩陣和多個變異后的轉換后的編碼數組對應的稀疏矩陣的評價函數值;
從排序后的評價函數值篩選出至少兩個評價函數值;
將至少兩個評價函數值對應的編碼數組重復進行以上操作,直至找到一個收斂評價函數值;
使用收斂評價函數值對應的稀疏矩陣進行語音識別。
2.根據權利要求1所述的方法,其特征在于,所述評價函數的函數公式為:
F=C+∑ib2i,其中,C為全零塊個數,bi為非零塊中的非零值的個數,F(xiàn)為評價函數值,∑為表示求和。
3.根據權利要求1所述的方法,其特征在于,所述深度神經網絡包括:輸入層、隱藏層、置換層和輸出層。
4.一種基于稀疏矩陣快速語音識別裝置,其特征在于,包括:
獲取模塊,用于獲取深度神經網絡的稀疏矩陣;
編碼模塊,對所述稀疏矩陣的行下標和列下標進行編碼,得到編碼數組;
轉換模塊,用于使用遺傳算法對編碼數組按照行或列進行編碼數據元素的隨機轉換,得到轉換后的編碼數組,其中,所述遺傳算法包括:選擇算子、交叉算子和變異算子;
選擇模塊,用于使用選擇算子選擇滿足一定標準的多個轉換后的編碼數組;
交叉模塊,用于使用交叉算子處理滿足一定標準的轉換后的編碼數組,得到多個交叉后的編碼數組;
變異模塊,用于使用變異算子處理所述多個交叉后的編碼數組,得到多個變異后的編碼數組;
計算模塊,用于使用評價函數計算轉換后的編碼數組對應的稀疏矩陣和多個變異后的轉換后的編碼數組對應的稀疏矩陣的評價函數值;
篩選模塊,用于從排序后的評價函數值篩選出至少兩個評價函數值;
迭代模塊,用于將至少兩個評價函數值對應的編碼數組重復進行以上操作,直至找到一個收斂評價函數值;
輸出模塊,用于使用收斂評價函數值對應的稀疏矩陣進行語音識別。
5.根據權利要求4所述的裝置,其特征在于,所述評價函數的函數公式為:
F=C+∑ib2i,其中,C為非零塊中非零值的個數,bi為非零塊中的非零值的個數,F(xiàn)為評價函數值,∑為表示求和。
6.根據權利要求4所述的方法,其特征在于,所述深度神經網絡包括:輸入層、隱藏層、置換層和輸出層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410801905.9/1.html,轉載請聲明來源鉆瓜專利網。





