[發(fā)明專利]基于棧混洗的新型通道混洗方法和裝置在審
| 申請?zhí)枺?/td> | 202110902470.7 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113743582A | 公開(公告)日: | 2021-12-03 |
| 發(fā)明(設(shè)計)人: | 裴頌偉;季語成 | 申請(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 張夢瑤 |
| 地址: | 100876 北京市海淀區(qū)西*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 棧混洗 新型 通道 方法 裝置 | ||
本申請?zhí)岢隽艘环N基于棧混洗的新型通道混洗方法,涉及通道混洗技術(shù)領(lǐng)域,其中,該方法包括:將通道序列化成對應(yīng)的數(shù)字,得到對應(yīng)的輸入通道序列;給定第一空棧作為通道混洗的場所,第二空棧作為輸出通道的保存場所;每次從輸入通道序列中隨機(jī)選擇push一個通道至第一空棧,或從第一空棧中pop一個通道,若輸入通道序列為空時,將第一空棧內(nèi)的元素全部pop清空;使用第二空棧接收從第一空棧pop出的通道,組成混洗后的通道序列作為輸出。采用上述方案的本申請可以更有益的對通道特征進(jìn)行均勻、可控的混洗融合。
技術(shù)領(lǐng)域
本申請涉及通道混洗技術(shù)領(lǐng)域,尤其涉及一種基于棧混洗的新型通道混洗方法和裝置。
背景技術(shù)
CNN庫最早提出了基于隨機(jī)稀疏化的卷積層概念,該層位于普通卷積后進(jìn)行隨機(jī)的通道混洗操作,由于其針對不同神經(jīng)網(wǎng)絡(luò)混洗方法各異,因此后續(xù)的研究很少利用這種方法進(jìn)行混洗。“兩步走”卷積的策略,采用了現(xiàn)有的隨機(jī)混洗方法并加以實(shí)現(xiàn),即通道采取隨機(jī)打亂的方式加以組合,隨機(jī)通道混洗帶來了模型壓縮和加速效果,因此該方法具有很強(qiáng)的局限性。
ShuffleNet網(wǎng)絡(luò)開辟了全新的通道混洗技術(shù),該混洗技術(shù)帶來了組內(nèi)信息的流動。該技術(shù)主要分成如下幾個步驟進(jìn)行:先把卷積通道分成g組,每組有n個通道,可以用(g,n)元素對進(jìn)行表示,把這些通道按組號作為行號,組內(nèi)編號作為列號進(jìn)行重塑,得到如圖2所示的排列,在該排列下12個通道被分成3組,每組4個通道,1-4為第一組,5-8為第二組,9-12為第三組,1-12為通道原有輸入的順序編號。在這基礎(chǔ)上,將該排列矩陣進(jìn)行一個轉(zhuǎn)置操作,得到如圖3所示的排列方式,可記為(g,g);轉(zhuǎn)置后的矩陣以列作為索引,按照每一列從上到下的順序,得到了混洗后的結(jié)果,可以表示(1,5,9)(2,6,10)(3,7,11)(4,8,12),將該矩陣展平之后,就形成了完整的混洗序列(1,5,9,2,6,10,3,7,11,4,8,12),將其輸入至下一層網(wǎng)絡(luò),就得到了新的分組方式,如圖4所示;如果新輸入層的分組數(shù)量需要改變,那么只需改變分組輸入矩陣的排列即可,轉(zhuǎn)置策略保持不變。
Zhang提出了一種新的混洗方法,先將通道按照索引編號,然后在所有可能的通道排列空間上學(xué)習(xí),以通道維度作為排列依據(jù),通過數(shù)學(xué)公式選擇合適的通道混洗方式,在CIFAR-10數(shù)據(jù)集上對ResNet網(wǎng)絡(luò)取得了一定的效果,但提升率十分有限。
縱觀現(xiàn)有的通道混洗技術(shù),基于隨機(jī)稀疏化的卷積層概念和“兩步走”卷積策略的技術(shù)對模型的精度損失較大,通常在2%-4%之間,同時,隨機(jī)混洗方法帶來的噪聲也十分顯著,不利于模型的快速收斂,ShuffleNet網(wǎng)絡(luò)開辟的全新通道混洗技術(shù)改善了隨機(jī)混洗的不足,通過行列轉(zhuǎn)置的方式進(jìn)行混洗,看似比較均勻,實(shí)則也有很大的缺陷,例如頭尾兩個通道在每次混洗時都不改變原有的次序。當(dāng)通道滿足g=n時,所有位于對角線上的通道都將不改變其原有的次序,如圖5所示。這將意味著不改變原有順序的通道數(shù)量位于[2,min(g,n)](g≥2,n≥2)之間,在所有通道里占比為這為模型精度性能的改善提供了可能。
Zhang提出的方法雖然比較新穎,但是在全排列空間下的NAS搜索依然會消耗大量的時間,由于其設(shè)定了參數(shù)P和Q作為通道間連接度考察的依據(jù),在某種程度上難以解釋其效果的提升。另一方面,其精度提升依舊十分有限,在ResNet-50網(wǎng)絡(luò)下相比ShuffleNet精度提升僅為0.11%,還不及未分組卷積情況下原模型的精度。
發(fā)明內(nèi)容
本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本申請的第一個目的在于提出一種基于棧混洗的新型通道混洗方法,解決了現(xiàn)有通道混洗方法中特征信息無法充分融合,進(jìn)而帶來神經(jīng)網(wǎng)絡(luò)模型精度損失的問題,通過提出的基于棧混洗的通道混洗方法,實(shí)現(xiàn)了對通道特征均勻、可控的混洗融合,既避免了隨機(jī)混洗下特征融合的不確定性,又避免了ShuffleNet中尚存在未充分混洗的問題,提升了模型壓縮的精度,同時還可以根據(jù)神經(jīng)網(wǎng)絡(luò)的特點(diǎn)設(shè)計出自己想要的混洗模式,控制特征的組間分布和組內(nèi)融合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110902470.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種高純氧化鉿的溶解方法
- 下一篇:一種基于水壓可自動排水的布料烘干房





