[發明專利]基于拆分-融合策略的分布式深度神經網絡結構轉換方法有效
| 申請號: | 202110462461.0 | 申請日: | 2021-04-27 |
| 公開(公告)號: | CN113255730B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 劉龍軍;鄭誼煥;侯文軒;張昊楠;李英翔;孫宏濱;鄭南寧 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06V10/80 | 分類號: | G06V10/80;G06V10/82;G06N3/0464;G06N3/08;G06N3/12 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 安彥彥 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 拆分 融合 策略 分布式 深度 神經網絡 結構 轉換 方法 | ||
基于拆分?融合策略的分布式深度神經網絡結構轉換方法,采集圖片,組成數據集,并將數據集分為訓練集和測試集,對訓練集和測試集中的圖片進行預處理;對網絡模型進行通道拆分,擴充網絡模型寬度,然后再添加融合層,得到改進后的網絡模型;采用訓練集中的圖片對改進后的網絡模型進行訓練后,將預處理之后的測試集中的圖片輸入到訓練后的網絡模型中,得到圖片分類結果。本發明針對分布式推理的場景對已有的用于圖片分類任務的網絡模型進行改進,轉換之后的網絡模型可以在資源受限的分布式系統中實現較快的推理速度,即可以在資源受限的分布式系統中執行圖片分類任務,并較快地得到分類結果,并且圖片具有更高的分類精度。
技術領域
本發明屬于人工智能技術領域,涉及一種基于拆分-融合策略的分布式深度神經網絡結構轉換方法,可以將現有的圖像分類的網絡模型轉換為適用于分布式系統的網絡模型,以在資源受限的分布式系統上執行圖像分類任務,也可用于目標檢測、語義分割等其他計算機視覺任務中。
背景技術
卷積神經網絡目前已經成為了圖片分類任務的主流方法,在CIFAR10、ImageNet等多個圖片分類數據集中取得了當前最佳的精度。為了能使該技術得到更廣泛的應用,將網絡模型部署到嵌入式和移動設備等硬件中是必須的。但主流的卷積神經網絡模型通常十分巨大,如VGG16的參數量高達138M,現有的硬件根本無法推理如此大的網絡。針對這些硬件,一些輕量化的網絡結構被通過手工設計或自動結構搜索的方法提出,如mobilenet系列,shufflenet系列,ghostnet,proxylessnas等,這些輕量化的網絡模型以深度卷積(depthwise?convolution)為核心操作,在保持參數量和計算量相對較少的同時,仍然能夠達到較高的精度,因而受到了人們的青睞。
但是,這些網絡模型都是針對單個硬件設計的,隨著物聯網(IoT)技術的迅猛發展,邊緣計算成為了最近的一個研究熱點和難點,在分布式系統中部署網絡模型逐漸成為了一個廣泛的需求,與在單個硬件上部署網絡相比,在分布式系統中部署網絡模型更加地困難,主要的原因有兩點:(1)一個分布式系統通常包含很多邊緣設備,單個邊緣節點的計算能力通常非常弱,甚至連一個輕量化網絡模型的推理都無法完成。(2)不同邊緣節點之間的通信會產生額外的開銷。
理論上說,直接將網絡模型部署到分布式系統中,令不同的邊緣節點推理不同的通道,是完全可以實現的。但是這種做法會帶來巨大的通信開銷,并嚴重拖慢系統的推理速度。這些額外的通信開銷是由網絡模型中的標準卷積(Standard?convolution)層帶來的,標準卷積的計算特性決定了其每一個輸出通道都依賴于所有的輸入通道,因此在推理每一個標準卷積層時,分布式系統的任意兩個節點之間都需要通信。
為了避免額外的通信開銷,可以將網絡模型中的卷積層全部轉換成組卷積,令不同的節點推理不同的組,這樣做每個節點所有的輸出通道只依賴于該節點的輸入通道,不同節點之間不再需要任何的通信。但是這樣做會帶來新的問題。在整個前向推理的過程中,網絡模型中不同的組之間沒有信息交流,即出現了“信息阻塞”現象,嚴重地影響網絡的精度。
現有的分布式推理方案(Deepthings,Fully?Deepthings)的并行策略是對網絡模型中每一層的特征圖進行了分割,令不同的節點推理特征圖的不同區域,但是這種策略在分布式系統上執行卷積神經網絡的圖片分類任務的推理時,仍然會帶來很大的額外開銷(通信開銷或計算開銷),該部分額外開銷會嚴重地拉長推理時間(得到分類結果所需的時間),對需要快速得到分類結果的場合影響巨大。
現有技術中對圖片分類存在精度低的問題。
發明內容
為克服現有技術中的問題,本發明的目的是提供一種基于拆分-融合策略的分布式深度神經網絡模型轉換方法。
為實現上述方法,本發明采用的技術方案如下:
基于拆分-融合策略的分布式深度神經網絡結構轉換方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110462461.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種盆底肌治療儀器
- 下一篇:一種綠色建筑節能防火鋼結構





