[發(fā)明專利]利用掩蔽參數(shù)的方法和裝置有效
| 申請?zhí)枺?/td> | 202010065642.5 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111476343B | 公開(公告)日: | 2023-05-26 |
| 發(fā)明(設(shè)計)人: | 金桂賢;金镕重;金寅洙;金鶴京;南云鉉;夫碩焄;成明哲;呂東勛;柳宇宙;張?zhí)┬?/a>;鄭景中;諸泓模;趙浩辰 | 申請(專利權(quán))人: | 斯特拉德視覺公司 |
| 主分類號: | G06N3/0464 | 分類號: | G06N3/0464;G06N3/084 |
| 代理公司: | 上海翼勝專利商標(biāo)事務(wù)所(普通合伙) 31218 | 代理人: | 翟羽 |
| 地址: | 韓國慶尚*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 掩蔽 參數(shù) 方法 裝置 | ||
本申請公開了一種利用掩蔽參數(shù)的方法和裝置及利用此方法和裝置的測試方法和測試裝置。該方法和裝置包括以下步驟:步驟(a),獲取輸入圖像后,計算裝置使CNN的卷積層產(chǎn)生與所述輸入圖像相對應(yīng)的特征圖;步驟(b),所述計算裝置使CNN的RPN通過所述特征圖來決定與所述輸入圖像所包含的至少一個物件相對應(yīng)的ROI;以及步驟(c),所述計算裝置使所述CNN的ROI池化層參照與每個池化計算相對應(yīng)的每個所述掩蔽參數(shù),且將每個所述池化計算適用于所述ROI內(nèi)的每個子區(qū)域,形成已掩蔽的池化特征圖。
技術(shù)領(lǐng)域
本申請涉及一種學(xué)習(xí)方法和裝置及利用此方法和裝置的測試方法和測試裝置。其中,利用一個以上掩蔽參數(shù)(masking?parameters)池化(Pulling)最少一個ROI的方法,包括:步驟(a),獲取輸入圖像后,計算裝置使CNN的卷積層產(chǎn)生與所述輸入圖像相對應(yīng)的特征圖;步驟(b),所述計算裝置使CNN的RPN通過所述特征圖決定與所述輸入圖像所包含的至少一個對象相對應(yīng)的ROI;以及步驟(c),所述計算裝置將所述CNN的ROI池化層參照與每個池化計算相對應(yīng)的每個所述掩蔽參數(shù),并將每個所述池化計算適用于所述ROI內(nèi)的每個子區(qū)域(sub-regions),從而形成已掩蔽的池化(pooled)特征圖{LEARNING?METHOD?ANDLEARNING?DEVICE?FOR?POOLING?ROI?BY?USING?MASKING?PARAMETERS?TO?BE?USED?FORMOBILE?DEVICES?OR?COMPACT?NETWORKS?VIA?HARDWARE?OPTIMIZATION,AND?TESTINGMETHOD?AND?TESTING?DEVICE?USING?THE?SAME}。
背景技術(shù)
深度卷積神經(jīng)網(wǎng)絡(luò)(Deep?Convolutional?Neural?Network?or?Deep?CNN)是發(fā)生在深度學(xué)習(xí)領(lǐng)域中耀眼發(fā)展的核心。90年代,雖然使用CNN解決識別字體的問題,但到了近代才廣泛應(yīng)用于機(jī)械學(xué)習(xí)(Machine?Learning)領(lǐng)域中。例如,CNN在2012年圖像識別競賽(ImageNet?Large?Scale?Visual?Recognition?Challenge)中超過其它競爭對手獲得了冠軍。之后,在機(jī)械學(xué)習(xí)領(lǐng)域中成為非常有用的工具。
另外,ROI池化是利用與每個子區(qū)域(sub-regions)相對應(yīng)的每個代表特征值池化的方法,每個子區(qū)域包括在至少一個ROI,即感興趣區(qū)域(Region-of-Interest)。感興趣區(qū)域是至少一個輸入圖像的重要部分,即至少一個目標(biāo)對象所在的至少一部分。ROI池化廣泛應(yīng)用在機(jī)械學(xué)習(xí)上,并能夠減少計算負(fù)荷。
根據(jù)現(xiàn)有的ROI池化方法,通過RPN決定與輸入圖像包括的對象相對應(yīng)的ROI時,池化計算適用在ROI的每個子區(qū)域。通過池化計算,算出每個子區(qū)域相對應(yīng)的每個代表特征值。其中,子區(qū)域代表特征值是通過按每個子區(qū)域的每個特征值的平均值或按每個子區(qū)域的每個特征值的最大值形成。
圖4圖示了根據(jù)現(xiàn)有的ROI池化方法,形成代表特征值的步驟,其中所述代表特征值用于池化ROI。
參照圖4,可以看出通過按每個子區(qū)域與其相對應(yīng)的所有特征值形成每個代表特征值。
但是,現(xiàn)有的ROI池化方法中,雖然ROI的子區(qū)域是矩形,但隨機(jī)輸入圖像中包含的任意對象形狀通常不是矩形,因此相比需要,出現(xiàn)更多的存儲器訪問量的嚴(yán)重問題。因此,可能會出現(xiàn)子區(qū)域包括但輸入圖像的對象不包括的不必要的像素。對這些不必要的像素非效率且不必要的訪問,使池化結(jié)果產(chǎn)生歪曲或降低學(xué)習(xí)速度。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題。
本發(fā)明的另一個目的在于參照與ROI所包括的特征值相對應(yīng)的掩蔽參數(shù),提供用于訪問已優(yōu)化的存儲器的ROI池化方法。
如上述記載,為了達(dá)到本發(fā)明的目的,并實(shí)現(xiàn)本發(fā)明的特定效果,本發(fā)明提供如下特征結(jié)構(gòu)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于斯特拉德視覺公司,未經(jīng)斯特拉德視覺公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010065642.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





