[發明專利]非暫態計算機可讀記錄介質、操作方法和操作設備在審
| 申請號: | 202210933289.7 | 申請日: | 2022-08-04 |
| 公開(公告)號: | CN116108915A | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 橋本鐵太郎 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06N3/084 | 分類號: | G06N3/084;G06N3/082;G06N3/047;G06N3/048;G06N3/0464 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王偉楠;崔俊紅 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 非暫態 計算機 可讀 記錄 介質 操作方法 操作 設備 | ||
1.一種非暫態計算機可讀記錄介質,其存儲用于使計算機執行處理的操作程序,所述處理包括:
在學習模型中包括的層中的每一層中利用高精度數據類型執行第一學習;
在所述第一學習中執行量化的情況下,基于與第一量化誤差以及通過量化誤差的累積引起的衰減的程度相對應的閾值,計算在所述層中的每一層中要用于量化的位數;以及
重復地執行第二學習,直到所述第二學習收斂,所述第二學習包括針對所述層中的每一層的基于所計算的位數的數據類型的量化。
2.根據權利要求1所述的非暫態計算機可讀記錄介質,其中,所述位數的計算包括指數部分的位數和有效數部分的位數的計算。
3.根據權利要求2所述的非暫態計算機可讀記錄介質,其中,獲得衰減量等于或小于所述閾值的所述第一量化誤差的上限,并且基于所述第一量化誤差的上限來計算所述指數部分的位數。
4.根據權利要求2所述的非暫態計算機可讀記錄介質,其中,基于所述學習模型的輸出值來生成識別率不降低的條件,獲得滿足識別率不降低的條件的所述第一量化誤差的上限,并且基于所述第一量化誤差的上限來計算所述有效數部分的位數。
5.根據權利要求1所述的非暫態計算機可讀記錄介質,其中,
通過重復包括多次迭代的時期來執行包括所述第一學習和所述第二學習的所述學習模型的學習,
在多個預定時期中執行所述第一學習,
在所述預定時期中的所述第一學習的最后一次迭代中計算在所述層中的每一層中要用于所述量化的位數,以及
通過保持所述層中的每一層中的所述量化的數據類型來執行所述第二學習,直到所述學習達到下一預定時期或收斂。
6.一種由計算機實現的操作方法,所述操作方法包括:
在學習模型中包括的層中的每一層中利用高精度數據類型執行第一學習;
在所述第一學習中執行量化的情況下,基于與第一量化誤差以及通過量化誤差的累積引起的衰減的程度相對應的閾值,計算在所述層中的每一層中要用于量化的位數;以及
重復地執行第二學習,直到所述第二學習收斂,所述第二學習包括針對所述層中的每一層的基于所計算的位數的數據類型的量化。
7.一種操作設備,包括:
存儲器;以及
耦接至所述存儲器的處理器,所述處理器被配置成執行處理,所述處理包括:
在學習模型中包括的層中的每一層中利用高精度數據類型執行第一學習;
在所述第一學習中執行量化的情況下,基于與第一量化誤差以及通過量化誤差的累積引起的衰減的程度相對應的閾值,計算在所述層中的每一層中要用于量化的位數;以及
重復地執行第二學習,直到所述第二學習收斂,所述第二學習包括針對所述層中的每一層的基于所計算的位數的數據類型的量化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210933289.7/1.html,轉載請聲明來源鉆瓜專利網。





