[發明專利]一種降低時延神經網絡模型功耗的方法及裝置有效
| 申請號: | 202010163869.3 | 申請日: | 2020-03-11 |
| 公開(公告)號: | CN111428860B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 閆子魁 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G06N3/082 | 分類號: | G06N3/082;G06N3/049;G10L15/16 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 張楠楠 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 降低 神經網絡 模型 功耗 方法 裝置 | ||
本發明公開了一種降低時延神經網絡模型功耗的方法及裝置。所述方法包括:獲取第一時延神經網絡模型;將所述第一時延神經網絡模型中的原始矩陣分解為兩個目標矩陣,以得到第二時延神經網絡模型;對所述第二時延神經網絡模型進行訓練,以得到第三時延神經網絡模型;對所述第三時延神經網絡模型進行參數調整,以得到第四時延神經網絡模型;將所述第四時延神經網絡模型導入到預設嵌入式設備。通過本發明的技術方案,由于第四時延神經網絡參數量的少,使得計算量也變少,進而在預設設備使用時的功耗也大大減少,提高用戶體驗。
技術領域
本發明涉及語音識別技術領域,特別涉及一種降低時延神經網絡模型功耗的方法及裝置。
背景技術
時延神經網絡模型(TDNN)是一種人工神經網絡結構,TDNN被提出是用來分類語音信號中的音素以用于自動語音識別,因為語音識別中精確的分段或特征邊界的自動確定是困難的或不可能的,而TDNN識別音素及其基本的聲學/語音特征,與時間上的位置無關,不受時間偏移影響。
TDNN雖然識別效果好,但是TDNN的網絡參數量大,由于參數量大使得計算量也變大,進而導致具有TDNN的設備端的功耗變大,影響用戶體驗。
發明內容
本發明提供一種降低時延神經網絡模型功耗的方法及裝置,所述技術方案如下:
根據本發明實施例的第一方面,提供了一種降低時延神經網絡模型功耗的方法,包括:
獲取第一時延神經網絡模型;
將所述第一時延神經網絡模型中的原始矩陣分解為兩個目標矩陣,以得到第二時延神經網絡模型;對所述第二時延神經網絡模型進行訓練,以得到第三時延神經網絡模型;
對所述第三時延神經網絡模型進行參數調整,以得到第四時延神經網絡模型;
將所述第四時延神經網絡模型導入到預設嵌入式設備。
在一個實施例中,所述將所述第一時延神經網絡模型中的原始矩陣分解為兩個目標矩陣,以得到第二時延神經網絡模型,包括:
利用SVD技術將所述第一時延神經網絡模型中的原始矩陣剪裁成所述兩個目標矩陣;
基于所述第一時延神經網絡模型,通過所述兩個目標矩陣進行模型結構的構建,以得到所述第二時延神經網絡模型。
在一個實施例中,所述對所述第二時延神經網絡模型進行訓練,以得到第三時延神經網絡模型,包括:
獲取若干條語音數據;
將所述若干條語音數據中第一預設數目條語音數據確定為訓練集;
通過所述訓練集對所述第二時延神經網絡模型進行訓練,以得到所述第三時延神經網絡模型。
在一個實施例中,所述對第三時延神經網絡模型進行參數調整,以得到第四時延神經網絡模型,包括:
將所述若干條語音數據中第二預設數目條語音數據確定為驗證集;
通過所述驗證集對所述第三時延神經網絡模型進行參數調整,以得到所述第四時延神經網絡模型。
在一個實施例中,所述將所述第四時延神經網絡模型導入嵌入式設備,包括:
獲取所述嵌入式設備的導入指令;
判斷所述第四時延神經網絡模型是否滿足預設標準;
當所述第四時延神經網絡模型滿足預設標準時,根據所述導入指令將所述第四時延神經網絡模型導入所述嵌入式設備。
根據本發明實施例的第二方面,提供了一種降低時延神經網絡模型功耗的裝置,包括:
獲取模塊,用于獲取第一時延神經網絡模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010163869.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:酒店推薦方法、系統、電子設備和存儲介質
- 下一篇:一種可調節立方星旋轉工裝





