[發明專利]訓練的方法和裝置在審
| 申請號: | 202210062693.1 | 申請日: | 2022-01-19 |
| 公開(公告)號: | CN116523016A | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 劉松 | 申請(專利權)人: | OPPO廣東移動通信有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/063 |
| 代理公司: | 北京布瑞知識產權代理有限公司 11505 | 代理人: | 張欣 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 方法 裝置 | ||
本申請提供了一種訓練的方法和裝置。該方法用于訓練NPU的功耗預測模型,NPU包括多個硬件模塊,功耗預測模型的訓練數據集包括與多個硬件模塊一一對應的多組子訓練數據集。該方法包括:分別對所述多組子訓練數據集進行特征篩選,得到多組特征數據集;對所述多組特征數據集形成的總特征數據集進行特征篩選,得到目標特征數據集;根據所述目標特征數據集訓練所述功耗預測模型。本申請提供的訓練方法,通過對訓練數據進行由粗到細的局部篩選和由細到粗的整體篩選,提高了選擇的特征數據的準確度,并且提高了使用該特征數據訓練出的功耗預測模型的精度。
技術領域
本申請涉及人工智能領域,具體涉及一種訓練的方法和裝置。
背景技術
相關技術中在訓練NPU的功耗預測模型時,通常直接對所有訓練數據進行特征篩選,再根據篩選出的特征數據集訓練功耗模型。
該方法在篩選特征的過程中可能漏選重要的特征數據,導致最終訓練出的功耗預測模型精度較低。
發明內容
本申請提供一種訓練的方法和裝置,以提高訓練出的NPU功率預測模型的精度。
第一方面,提供一種預測的方法,該方法用于訓練NPU的功耗預測模型,NPU包括多個硬件模塊,功耗預測模型的訓練數據集包括與多個硬件模塊一一對應的多組子訓練數據集,該方法包括:分別對多組子訓練數據集進行特征篩選,得到多組特征數據集;對多組特征數據集形成的總特征數據集進行特征篩選,得到目標特征數據集;根據目標特征數據集訓練功耗預測模型。
可選地,在一些實施例中,訓練數據集包括NPU內部的電信號的翻轉次數以及電信號的翻轉次數對應的功耗。
可選地,在一些實施例中,多個硬件模塊包括以下模塊中的部分或全部模塊:矩陣乘法處理器模塊、部分累加處理器模塊、向量數據處理器計算單元模塊、向量數據處理器儲存單元模塊以及指令發布處理器模塊。
可選地,在一些實施例中,特征篩選采用基模型選擇法和/或方差選擇法。
可選地,在一些實施例中,基模型選擇法的基模型包括GBDT回歸法。
第二方面,提供一種訓練的裝置,該裝置用于訓練NPU的功耗預測模型,NPU包括多個硬件模塊,功耗預測模型的訓練數據集包括與多個硬件模塊一一對應的多組子訓練數據集。該裝置包括:獲取單元,被配置為分別對所述多組子訓練數據集進行特征篩選,得到多組特征數據集;篩選單元,被配置為對所述多組特征數據集形成的總特征數據集進行特征篩選,得到目標特征數據集;訓練單元,被配置為根據所述目標特征數據集訓練所述功耗預測模型。
可選地,在一些實施例中,訓練數據集包括NPU內部的電信號的翻轉次數以及電信號的翻轉次數對應的功耗。
可選地,在一些實施例中,多個硬件模塊包括以下模塊中的部分或全部模塊:矩陣乘法處理器模塊、部分累加處理器模塊、向量數據處理器計算單元模塊、向量數據處理器儲存單元模塊以及指令發布處理器模塊。
可選地,在一些實施例中,特征篩選采用基模型選擇法和/或方差選擇法。
可選地,在一些實施例中,基模型選擇法的基模型包括GBDT回歸法。
第三方面,提供一種訓練裝置,包括存儲器和處理器,存儲器中存儲有可執行代碼,處理器被配置為執行所述可執行代碼,以實現第一方面所述的方法。
第四方面,提供一種計算機可讀存儲介質,其上存儲有可執行代碼,當所述可執行代碼被執行時,能夠實現如第一方面所述的方法。
第五方面,提供一種計算機程序產品,包括可執行代碼,當所述可執行代碼被執行時,能夠實現如第一方面所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于OPPO廣東移動通信有限公司,未經OPPO廣東移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210062693.1/2.html,轉載請聲明來源鉆瓜專利網。





