[發(fā)明專利]一種基于生成對抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法及裝置有效
| 申請?zhí)枺?/td> | 202011293572.5 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112288032B | 公開(公告)日: | 2022-01-14 |
| 發(fā)明(設(shè)計)人: | 康燕斌;張志齊 | 申請(專利權(quán))人: | 上海依圖網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 朱佳 |
| 地址: | 200051 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 生成 對抗 網(wǎng)絡(luò) 量化 模型 訓(xùn)練 方法 裝置 | ||
本公開涉及計算機技術(shù),特別涉及一種基于生成對抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法及裝置。用以降低模型在低比特量化時的性能損失,該方法為:服務(wù)器采用對抗方式對第一分類模型、第一分類模型量化后的第二分類模型,以及第三分類模型進(jìn)行訓(xùn)練,將樣本數(shù)據(jù)分別輸入第一分類模型和第二分類模型,將獲得的第一處理結(jié)果和第二處理結(jié)果,以及樣本數(shù)據(jù),輸入第三分類模型,得到第三處理結(jié)果,再通過對第三處理結(jié)果與真實結(jié)果進(jìn)行比對獲得相應(yīng)的梯度,并采用梯度對第一分類模型,第二分類模型以及第三分類模型進(jìn)行參數(shù)調(diào)整,最終,輸出訓(xùn)練完畢的第二分類模型。這樣,既降低了第一分類模型在低比特量化時的性能損失,也保證了第二分類模型的精度不受影響。
技術(shù)領(lǐng)域
本公開涉及計算機技術(shù),特別涉及一種基于生成對抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法及裝置。
背景技術(shù)
在日常生活中,在不同使用場景下,對模型精度有不同的要求,特定場景下,模型的精度可以滿足日常的生活需求即可,例如,計算圓的周長的模型,僅僅需要使用3.14代表圓周率即可,無需在計算時使用精確到小數(shù)點后幾十位,甚至上百位,因此,我們需要對一些模型進(jìn)行量化。
但是,相關(guān)技術(shù)下,所述量化技術(shù)都會降低模型的精確度,同時也難以保證量化后模型的性能。
因此,需要一種新的量化模型訓(xùn)練的方法及裝置,以克服上述缺陷。
發(fā)明內(nèi)容
本公開提供一種基于生成對抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法及裝置,用以降低模型在低比特量化時的性能損失。
本發(fā)明提供的具體技術(shù)方案如下:
第一方面,一種基于生成對抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法,包括:
確定第一分類模型,第二分類模型以及第三分類模型,其中所述第二分類模型為所述第一分類模型經(jīng)過量化后得到的模型,所述第三分類模型為與第一模型不同的模型;
基于樣本數(shù)據(jù)集合,采用循環(huán)迭代方式執(zhí)行以下步驟,直到訓(xùn)練完畢為止:
將樣本數(shù)據(jù)分別輸入所述第一分類模型和所述第二分類模型,得到相應(yīng)的第一處理結(jié)果和第二處理結(jié)果;
將所述樣本數(shù)據(jù),所述第一處理結(jié)果和所述第二處理結(jié)果,輸入所述第三分類模型,得到第三處理結(jié)果;
將第三處理結(jié)果與真實結(jié)果進(jìn)行誤差比較,獲得相應(yīng)的梯度,并采用所述梯度對第一分類模型,第二分類模型以及第三分類模型進(jìn)行參數(shù)調(diào)整;輸出訓(xùn)練完畢的第二分類模型。
可選的,確定第一分類模型,第二分類模型以及第三分類模型之前,進(jìn)一步包括:
將訓(xùn)練完成后的第一分類模型直接進(jìn)行量化,將量化后的第一分類模型作為第二分類模型;
或者,
將帶有模擬量化的噪聲數(shù)據(jù)的樣本數(shù)據(jù)集合,送入所述第一分類模型進(jìn)行訓(xùn)練,輸出訓(xùn)練完成后的第一分類模型,作為第二分類模型。
可選的,將所述樣本數(shù)據(jù),所述第一處理結(jié)果和所述第二處理結(jié)果,輸入所述第三分類模型,得到第三處理結(jié)果,包括:
將所述樣本數(shù)據(jù)、所述第一分類模型和所述第二分類模型在分類過程中使用的各個標(biāo)簽、所述第一處理結(jié)果和所述第二處理結(jié)果,輸入所述第三分類模型,得到第三處理結(jié)果,所述第三處理結(jié)果表征所述第一處理結(jié)果是否由所述第一分類模型輸出,以及所述第二處理結(jié)果是否由所述第二分類模型輸出。
可選的,采用所述梯度對第一分類模型,第二分類模型以及第三分類模型進(jìn)行參數(shù)調(diào)整,包括:
采用所述梯度,對所述第一分類模型以及所述第二分類模型分別進(jìn)行參數(shù)調(diào)整,使得參數(shù)調(diào)整后的第一分類模型再次輸出的第一處理結(jié)果與參數(shù)調(diào)整后的第二分類模型再次輸出的第二處理結(jié)果趨于相同;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海依圖網(wǎng)絡(luò)科技有限公司,未經(jīng)上海依圖網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011293572.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





