[發明專利]提高深度學習模型預測能力的方法、電子設備和存儲介質有效
| 申請號: | 201910379961.0 | 申請日: | 2019-05-08 |
| 公開(公告)號: | CN110276096B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 段琳;劉京亮;王國亞 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F30/20 | 分類號: | G06F30/20;G06N3/08 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;張芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提高 深度 學習 模型 預測 能力 方法 電子設備 存儲 介質 | ||
1.一種提高深度學習模型預測能力的方法,其特征在于,包括:
向待測試設備發送多組矩陣,以使所述待測試設備對每組所述矩陣中的至少兩個矩陣進行矩陣乘運算并輸出運算結果,所述運算結果為結果矩陣,其中每組所述矩陣具有不同的維度信息,所述維度信息用于指示矩陣乘運算的運算量和數據量,其中每組所述矩陣包括至少兩個矩陣,所述每組矩陣的維度信息包括至少兩個矩陣的維度信息;
獲取所述待測試設備輸出每個所述運算結果的運算時間;
根據所述每組矩陣的維度信息、每組所述矩陣對應的結果矩陣的維度信息,以及所述待測試設備輸出每個所述運算結果的運算時間,獲取所述待測試設備的roofline模型;
根據待測試深度學習模型的運算量和數據量,以及所述待測試設備的roofline模型,對所述待測試設備進行處理,以提高所述待測試深度學習模型的預測性能,所述待測試設備用于對所述待測試深度學習模型進行運算;
每組所述矩陣中包括第一矩陣和第二矩陣,所述第一矩陣的列數和所述第二矩陣的行數相同;
每組所述矩陣的維度信息包括:所述第一矩陣的維度信息和所述第二矩陣的維度信息;所述獲取所述待測試設備的roofline模型,包括:
根據每組所述矩陣中所述第一矩陣的維度信息、所述第二矩陣的維度信息、所述結果矩陣的維度信息,獲取每組所述矩陣對應的矩陣乘的運算量和數據量;
根據每組所述矩陣對應的所述矩陣乘的運算量和數據量,獲取每組所述矩陣對應的運算強度;
根據每組所述矩陣對應的所述矩陣乘的運算量和所述待測試設備的運算時間,獲取每組所述矩陣對應的所述待測試設備的運算性能;
根據每組所述矩陣對應的運算強度和所述待測試設備的運算性能,獲取所述待測試設備的roofline模型。
2.根據權利要求1所述的方法,其特征在于,所述向待測試設備發送多組矩陣之前,還包括:
接收多個維度信息,根據所述多個維度信息生成每個所述維度信息對應的每組所述矩陣。
3.根據權利要求1所述的方法,其特征在于,所述獲取每組所述矩陣對應的矩陣乘的運算量和數據量,包括:
根據如下公式一獲取每組所述矩陣對應的矩陣乘的運算量C:
C=(m×k×n)×a公式一
根據如下公式二獲取每組所述矩陣對應的矩陣乘的數據量M:
M=(m×k+k×n+m×n)×b公式二
其中,m為每組所述矩陣中所述第一矩陣的行數,k為每組所述矩陣中所述第一矩陣的列數、所述第二矩陣的行數,n為每組所述矩陣中所述第二矩陣的列數,a和b為常數。
4.根據權利要求1所述的方法,其特征在于,所述獲取所述待測試設備的roofline模型之前,還包括:
判斷每個所述結果矩陣是否正確;
若否,則將錯誤的結果矩陣對應的第一矩陣和第二矩陣發送給待測試設備,以使所述待測試設備重新進行矩陣乘運算。
5.根據權利要求2所述的方法,其特征在于,所述第一矩陣的維度信息和所述第二矩陣的維度信息相同;
所述根據所述多個維度信息生成每個所述維度信息對應的每組所述矩陣,包括:
依次接收每個維度信息,生成每個所述維度信息對應的每組所述矩陣,直至接收到的維度信息包括的所述第一矩陣的維度信息與預設維度信息相同;后一次接收到的維度信息包括的所述第一矩陣的維度大于前一次接收到的維度信息包括的所述第一矩陣的維度;
所述向待測試設備發送多組矩陣,包括:
依次向所述待測試設備發送生成的每個維度信息對應的每組所述矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910379961.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種工件模型輪廓線形狀自適應分解方法及裝置
- 下一篇:掌子面錨桿支護設計方法





