[發(fā)明專利]一種終端部署方法和裝置有效
| 申請?zhí)枺?/td> | 201811150239.1 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN110163367B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 侯金龍;黃俊洲;吳家祥;張堯 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N3/082 | 分類號: | G06N3/082;G06N3/092;G06N3/0985 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 終端 部署 方法 裝置 | ||
本申請實施例公開了一種模型壓縮方法及裝置,在獲取待壓縮模型和針對該待壓縮模型的壓縮偏好配置時,可以根據(jù)待壓縮模型的模型類型和壓縮偏好配置確定出壓縮算法組件和對應(yīng)的算法超參數(shù)取值,并利用上述壓縮算法組件和算法超參數(shù)取值對待壓縮模型進行第一次壓縮,得到第一次壓縮對應(yīng)的候選壓縮結(jié)果。若第一次壓縮對應(yīng)的候選壓縮結(jié)果的性能參數(shù)與壓縮偏好配置的符合程度未滿足預(yù)設(shè)條件,繼續(xù)生成調(diào)參策略以調(diào)整下一次壓縮所用的壓縮算法組件和算法超參數(shù)取值,直到某一次壓縮對應(yīng)的候選壓縮結(jié)果的性能參數(shù)與所述壓縮偏好配置的符合程度滿足預(yù)設(shè)條件為止。不需要人工調(diào)整壓縮算法,避免了人為經(jīng)驗帶來的影響,提高了壓縮效率。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理領(lǐng)域,特別是涉及一種終端部署方法和裝置。
背景技術(shù)
網(wǎng)絡(luò)模型可以部署在不同類型的處理設(shè)備上,處理設(shè)備可以通過所部署的網(wǎng)絡(luò)模型實現(xiàn)特定的功能,例如圖像識別,數(shù)據(jù)分類等。
然而一些情況下,在部署在處理設(shè)備之前,需要對網(wǎng)絡(luò)模型進行壓縮。一部分原因在于,一些網(wǎng)絡(luò)模型的性能參數(shù)并不好,例如模型占用空間比較大,計算性能不高,運行速度低等,這類網(wǎng)絡(luò)模型一般是基于人類經(jīng)驗設(shè)計的網(wǎng)絡(luò)模型,或者開發(fā)經(jīng)驗不足的開發(fā)者所開發(fā)的網(wǎng)絡(luò)模型。當(dāng)這類網(wǎng)絡(luò)模型部署到處理設(shè)備后不僅浪費系統(tǒng)資源,而且達不到相應(yīng)計算性能。故需要對這類網(wǎng)絡(luò)模型進行壓縮,以優(yōu)化網(wǎng)絡(luò)模型的性能。或者,另一部分原因在于,一些需要部署網(wǎng)絡(luò)模型的處理設(shè)備的處理能力并不高,難以支持部署高性能參數(shù)的網(wǎng)絡(luò)模型,故需要對這類網(wǎng)絡(luò)模型進行壓縮,在不過多損失性能參數(shù)的情況下,達到能夠被部署到低處理能力的處理設(shè)備中的條件。
傳統(tǒng)的網(wǎng)絡(luò)模型壓縮方式主要依靠壓縮人員的壓縮經(jīng)驗,壓縮人員需要根據(jù)自身經(jīng)驗,在壓縮過程中基于壓縮需求人工調(diào)整壓縮算法的參數(shù),嚴(yán)重影響壓縮效率和導(dǎo)致不穩(wěn)定的壓縮精度。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本申請?zhí)峁┝艘环N終端部署方法及裝置。
本申請實施例公開了如下技術(shù)方案:
第一方面,本申請實施例提供了一種模型壓縮方法,所述方法包括:
獲取待壓縮模型和壓縮偏好配置,所述壓縮偏好配置用于標(biāo)識所述待壓縮模型被壓縮后具有的性能參數(shù);
根據(jù)所述待壓縮模型的模型類型和所述壓縮偏好配置,確定第一次壓縮對應(yīng)的壓縮算法組件和算法超參數(shù)取值;
根據(jù)第一次壓縮對應(yīng)的算法超參數(shù)取值,通過第一次壓縮對應(yīng)的壓縮算法組件對所述待壓縮模型進行壓縮,得到第一次壓縮對應(yīng)的候選壓縮結(jié)果;
若第一次壓縮對應(yīng)的候選壓縮結(jié)果的性能參數(shù)與所述壓縮偏好配置的符合程度不滿足預(yù)設(shè)條件,根據(jù)確定出的調(diào)參策略調(diào)整壓縮算法組件和算法超參數(shù)取值繼續(xù)進行壓縮;其中,第i次壓縮的壓縮對象為第i-1次壓縮得到的候選壓縮結(jié)果,第i次壓縮對應(yīng)的壓縮算法組件和算法超參數(shù)取值是根據(jù)第i次壓縮對應(yīng)的調(diào)參策略調(diào)整得到的,第i次壓縮對應(yīng)的調(diào)參策略是基于第i-1次壓縮對應(yīng)的候選壓縮結(jié)果的性能參數(shù)與所述壓縮偏好配置的符合程度確定的;
若第i次壓縮對應(yīng)的候選壓縮結(jié)果的性能參數(shù)與所述壓縮偏好配置的符合程度滿足預(yù)設(shè)條件,將第i次壓縮對應(yīng)的候選壓縮結(jié)果作為所述待壓縮模型的壓縮模型。
第二方面,本申請實施例提供了一種模型壓縮裝置,所述裝置包括:
第一獲取單元,用于獲取待壓縮模型和壓縮偏好配置,所述壓縮偏好配置用于標(biāo)識所述待壓縮模型被壓縮后具有的性能參數(shù);
第一確定單元,用于根據(jù)所述待壓縮模型的模型類型和所述壓縮偏好配置,確定第一次壓縮對應(yīng)的壓縮算法組件和算法超參數(shù)取值;
第一壓縮單元,用于根據(jù)第一次壓縮對應(yīng)的算法超參數(shù)取值,通過第一次壓縮對應(yīng)的壓縮算法組件對所述待壓縮模型進行壓縮,得到第一次壓縮對應(yīng)的候選壓縮結(jié)果;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811150239.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種業(yè)務(wù)處理執(zhí)行語言流程部署方法
- 云計算平臺應(yīng)用快速部署的管理方法
- 虛擬化網(wǎng)絡(luò)功能部署方法及系統(tǒng)
- 版本部署的方法、裝置、設(shè)備和計算機存儲介質(zhì)
- 測試環(huán)境部署方法、部署裝置及存儲介質(zhì)
- 程序部署任務(wù)執(zhí)行方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種基于Ansible的輕量級容器化分布式系統(tǒng)與部署方法
- 模型部署方法、模型部署裝置及終端設(shè)備
- 系統(tǒng)部署狀態(tài)的可視化方法、裝置、設(shè)備及可讀存儲介質(zhì)
- 一種任務(wù)部署方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)





