[發(fā)明專利]信息處理裝置和方法以及記錄介質在審
| 申請?zhí)枺?/td> | 202010921272.0 | 申請日: | 2020-09-04 |
| 公開(公告)號: | CN112508167A | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設計)人: | 坂井靖文 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王萍;姚文杰 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 方法 以及 記錄 介質 | ||
1.一種信息處理裝置,包括:
存儲器,以及
耦接至所述存儲器的處理器,所述處理器被配置成:
計算要在神經(jīng)網(wǎng)絡中使用的變量被量化時的量化誤差;
基于與通過所述神經(jīng)網(wǎng)絡的過往學習獲得的第一識別率有關的參考信息和通過所述神經(jīng)網(wǎng)絡的計算獲得的第二識別率來生成閾值;
基于所計算的量化誤差和所生成的閾值來確定要用于所述神經(jīng)網(wǎng)絡的計算的變量之中的要量化的數(shù)據(jù)類型的變量,以及
通過使用所述數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的計算。
2.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成通過將所述神經(jīng)網(wǎng)絡的計算分成多個計算周期來執(zhí)行所述計算,并且
在所述多個計算周期中的每個計算周期中,用于執(zhí)行所述神經(jīng)網(wǎng)絡的計算的處理包括:
在確定要量化的變量的類型確定時段中,通過使用在所述計算周期的前一計算周期中確定的數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的計算,以及
在所述類型確定時段之后的計算執(zhí)行時段中,通過使用所確定的數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的計算。
3.根據(jù)權利要求2所述的信息處理裝置,其中
用于計算量化誤差的處理、用于生成閾值的處理以及用于確定量化變量的處理在所述類型確定時段中執(zhí)行,并且不在所述計算執(zhí)行時段中執(zhí)行。
4.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:
計算由所述參考信息指示的所述第一識別率與所述第二識別率之間的第一差;
基于所計算的第一差來生成所述閾值的更新量,以及
基于所生成的更新量和當前閾值來計算更新之后的閾值。
5.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:
生成閾值包括:生成單個閾值,以及
確定要量化的變量包括:基于生成的共同閾值來確定所有變量之中的要量化的變量。
6.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:
生成閾值包括:針對所述變量的每種類型生成所述閾值,以及
確定要量化的變量包括:基于針對所述變量的每種類型的所生成的閾值,針對所述變量的每種類型確定要量化的變量。
7.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:
基于所述量化誤差和所述閾值,確定要在所述神經(jīng)網(wǎng)絡中使用的多個變量之中的第一變量的數(shù)據(jù)類型,以及
將除了所述第一變量以外的第二變量的數(shù)據(jù)類型固定為定點型。
8.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:針對所述神經(jīng)網(wǎng)絡中包括的多個層中的每個層,計算要在每個層中使用的變量的量化誤差。
9.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:基于所計算的量化誤差和所生成的閾值,通過要在每個層中使用的所述變量的單元來確定所述要量化的變量。
10.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:通過使用所確定的數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的學習。
11.根據(jù)權利要求1所述的信息處理裝置,其中,所述處理器被配置成:通過使用所確定的數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的推理。
12.一種信息處理方法,其由計算機執(zhí)行,所述信息處理方法包括:
計算要在神經(jīng)網(wǎng)絡中使用的變量被量化時的量化誤差;
基于與通過所述神經(jīng)網(wǎng)絡的過往學習獲得的第一識別率有關的參考信息和通過所述神經(jīng)網(wǎng)絡的計算獲得的第二識別率來生成閾值;
基于所計算的量化誤差和所生成的閾值來確定要用于所述神經(jīng)網(wǎng)絡的計算的變量之中的要量化的數(shù)據(jù)類型的變量,以及
通過使用所述數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的計算。
13.一種非暫態(tài)計算機可讀存儲介質,其存儲使計算機執(zhí)行處理的程序,所述處理包括:
計算要在神經(jīng)網(wǎng)絡中使用的變量被量化時的量化誤差;
基于與通過所述神經(jīng)網(wǎng)絡的過往學習獲得的第一識別率有關的參考信息和通過所述神經(jīng)網(wǎng)絡的計算獲得的第二識別率來生成閾值;
基于所計算的量化誤差和所生成的閾值來確定要用于所述神經(jīng)網(wǎng)絡的計算的變量之中的要量化的數(shù)據(jù)類型的變量;以及
通過使用所述數(shù)據(jù)類型的變量來執(zhí)行所述神經(jīng)網(wǎng)絡的計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010921272.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





