[發(fā)明專利]用于多問題求解的異構(gòu)卷積神經(jīng)網(wǎng)絡(luò)在審
| 申請(qǐng)?zhí)枺?/td> | 201910168716.5 | 申請(qǐng)日: | 2019-03-06 |
| 公開(公告)號(hào): | CN110232304A | 公開(公告)日: | 2019-09-13 |
| 發(fā)明(設(shè)計(jì))人: | I·F·G·曼蘇爾;H·B·塞弗特 | 申請(qǐng)(專利權(quán))人: | 德韌營(yíng)運(yùn)有限責(zé)任公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 林偉峰 |
| 地址: | 美國(guó)密*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 輸入圖像 子網(wǎng)絡(luò) 異構(gòu) 表示數(shù)據(jù) 對(duì)象檢測(cè) 對(duì)象類別 分割數(shù)據(jù) 復(fù)雜特征 復(fù)雜形狀 簡(jiǎn)單形式 接收系統(tǒng) 數(shù)據(jù)輸出 特征提取 問題求解 垂直線 第一層 堆疊層 對(duì)象表 后續(xù)層 激活層 像素級(jí) 網(wǎng)格 池化 堆疊 卷積 色塊 拾取 創(chuàng)建 捕獲 集合 視覺 分割 分類 檢測(cè) 學(xué)習(xí) | ||
一種異構(gòu)卷積神經(jīng)網(wǎng)絡(luò)(HCNN)系統(tǒng),包括產(chǎn)生輸入圖像的視覺接收系統(tǒng)。卷積神經(jīng)網(wǎng)絡(luò)的特征提取層(FEL)部分包括堆疊在一起的多個(gè)卷積層、池化層與激活層。FEL包括多個(gè)堆疊層,第一層集合學(xué)習(xí)以簡(jiǎn)單形式(包括水平和垂直線和色塊)表示數(shù)據(jù)。其后層捕獲更復(fù)雜形狀,諸如圓形、矩形和三角形。后續(xù)層拾取復(fù)雜特征組合來形成包括輪、面和網(wǎng)格的表示。FEL部分將數(shù)據(jù)輸出至以下各者中的每一者:第一子網(wǎng)絡(luò),其執(zhí)對(duì)輸入圖像中的對(duì)象類別執(zhí)行對(duì)象檢測(cè)、分類和定位以創(chuàng)建檢測(cè)到的對(duì)象表的第一任務(wù);和第二子網(wǎng)絡(luò),其執(zhí)行定義像素級(jí)分割以創(chuàng)建分割數(shù)據(jù)集的第二任務(wù)。
技術(shù)領(lǐng)域
本公開大體涉及人工智能卷積神經(jīng)網(wǎng)絡(luò)。
背景技術(shù)
本部分中的陳述僅僅提供與本公開有關(guān)的背景資料,且可構(gòu)成或可不構(gòu)成現(xiàn)有技術(shù)。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)正用來解決計(jì)算機(jī)視覺中的問題,包括圖像分類、對(duì)象檢測(cè)和對(duì)象分割問題。CNN可由一個(gè)或多個(gè)卷積層組成,通常包括子采樣步驟,緊接著是類似于標(biāo)準(zhǔn)多層神經(jīng)網(wǎng)絡(luò)的一個(gè)或多個(gè)全連接層。CNN的架構(gòu)設(shè)計(jì)成利用輸入圖像(包括來自相機(jī)的像素圖像)的2D結(jié)構(gòu)。這包括局部連接和綁定權(quán)重,緊接著是某種形式的池化,其產(chǎn)生平移不變特征。CNN的益處包括相比具有相同數(shù)量的隱藏單元的全連接網(wǎng)絡(luò),其易于訓(xùn)練且具有較少的參數(shù)。
傳統(tǒng)CNN不同時(shí)解決兩個(gè)或兩個(gè)以上獨(dú)立問題。舉例來說,已知CNN在應(yīng)用于汽車車輛輔助和自主控制系統(tǒng)時(shí),不能同時(shí)執(zhí)行包括分類及定位,和道路分割(車道檢測(cè))問題的對(duì)象檢測(cè)。這需要車輛計(jì)算機(jī)系統(tǒng)執(zhí)行多個(gè)并行或獨(dú)立計(jì)算步驟,從而需要更長(zhǎng)的計(jì)算時(shí)間和更多內(nèi)存。
因此,雖然當(dāng)前汽車人工智能系統(tǒng)CNN實(shí)現(xiàn)了其預(yù)期目的,但仍需要允許多問題求解的新的及改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)。
發(fā)明內(nèi)容
根據(jù)若干方面,一種異構(gòu)卷積神經(jīng)網(wǎng)絡(luò)(HCNN)系統(tǒng),包括產(chǎn)生輸入圖像的視覺接收系統(tǒng)。卷積神經(jīng)網(wǎng)絡(luò)中的特征提取機(jī)構(gòu)包括卷積神經(jīng)網(wǎng)絡(luò)的特征提取層(FEL),其具有彼此堆疊在一起的多個(gè)卷積、池化與激活層,直接接收輸入圖像,進(jìn)行學(xué)習(xí)操作以學(xué)習(xí)表示輸入圖像的第一階段數(shù)據(jù)。FEL包括多個(gè)不同的堆疊層,其中第一層集合(直接在輸入圖像之后的層)學(xué)習(xí)以非常簡(jiǎn)單的形式(諸如水平和垂直線以及簡(jiǎn)單的色塊)表示數(shù)據(jù)。其后層捕獲更復(fù)雜形狀,諸如圓形、矩形、三角形等等。后續(xù)層從一個(gè)或多個(gè)先前層拾取特征的復(fù)雜組合以形成更有意義的表示,諸如輪、面、網(wǎng)格等等。所有上述情況均發(fā)生在FEL內(nèi)部,因此HCNN通過針對(duì)子網(wǎng)絡(luò)中的每一者僅執(zhí)行一次上述動(dòng)作,節(jié)省了計(jì)算、內(nèi)存,并使執(zhí)行加速。FEL部分將第一階段數(shù)據(jù)輸出至以下各者:第一子網(wǎng)絡(luò),其對(duì)輸入圖像中的對(duì)象類別執(zhí)行對(duì)象檢測(cè)、分類和定位以創(chuàng)建檢測(cè)到的對(duì)象表的第一任務(wù);和第二子網(wǎng)絡(luò),其執(zhí)行定義像素級(jí)分割以創(chuàng)建分割數(shù)據(jù)集的第二任務(wù)。第一階段數(shù)據(jù)包括從輸入圖像捕獲的第一特征映射。
在本公開的另一方面,F(xiàn)EL部分包括第一卷積與池化層(CPL)部分,其接收所述第一階段的數(shù)據(jù),并且在第二階段數(shù)據(jù)中捕獲包括圓形、矩形、三角形等等的形狀。第一CPL部分將第二階段數(shù)據(jù)轉(zhuǎn)發(fā)至第一子網(wǎng)絡(luò)用于執(zhí)行第一任務(wù),即對(duì)輸入圖像中的對(duì)象類別執(zhí)行對(duì)象檢測(cè)、分類和定位以創(chuàng)建檢測(cè)到的對(duì)象表。FEL對(duì)于子網(wǎng)絡(luò)中的每一者都是公共的,并且在FEL提供各個(gè)特殊任務(wù)(包括像素級(jí)分割和對(duì)象檢測(cè)、分類和定位)之后,分離成專用層時(shí)被重復(fù)利用。
在本公開的另一方面,F(xiàn)EL部分包括第二CPL部分,該第二CPL部分捕獲定義復(fù)雜幾何形狀的第三階段數(shù)據(jù),第三階段數(shù)據(jù)包括第一階段數(shù)據(jù)與第二階段數(shù)據(jù)的組合和復(fù)雜特征組合以形成包括輪、面和網(wǎng)格的表示,第二CPL部分將第三階段數(shù)據(jù)轉(zhuǎn)發(fā)至第一子網(wǎng)絡(luò)用于執(zhí)行第一任務(wù),即對(duì)輸入圖像中的對(duì)象類別執(zhí)行對(duì)象檢測(cè)、分類和定位以創(chuàng)建檢測(cè)到的對(duì)象表。
在本公開的另一方面,通過最小化第二子網(wǎng)絡(luò)的損失函數(shù)同時(shí)凍結(jié)第一子網(wǎng)絡(luò)來訓(xùn)練第二子網(wǎng)絡(luò)。
在本公開的另一方面,通過最小化第一子網(wǎng)絡(luò)的損失函數(shù)同時(shí)凍結(jié)第二子網(wǎng)絡(luò)來訓(xùn)練第一子網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于德韌營(yíng)運(yùn)有限責(zé)任公司,未經(jīng)德韌營(yíng)運(yùn)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910168716.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測(cè)方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法及檢測(cè)裝置
- 一種微電網(wǎng)電磁暫態(tài)實(shí)時(shí)仿真的方法及系統(tǒng)
- 網(wǎng)絡(luò)切片子網(wǎng)的選擇方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)切片的管理方法及系統(tǒng)和存儲(chǔ)介質(zhì)
- 用于雙向網(wǎng)絡(luò)地理信息傳送的系統(tǒng)、方法及設(shè)備
- 多跳異構(gòu)無線網(wǎng)絡(luò)中多任務(wù)路由的方法、網(wǎng)絡(luò)及節(jié)點(diǎn)
- 基于高精度神經(jīng)網(wǎng)絡(luò)的圖像處理方法、裝置及電子設(shè)備
- 一種前向耗時(shí)的確定方法、裝置及設(shè)備
- 超網(wǎng)絡(luò)參數(shù)更新方法、裝置和電子設(shè)備
- 一種基于網(wǎng)絡(luò)分解的大規(guī)模橋梁網(wǎng)絡(luò)連通概率評(píng)估方法
- 電信網(wǎng)絡(luò)
- 一種異構(gòu)路由協(xié)調(diào)系統(tǒng)及方法
- 一種用于提供網(wǎng)絡(luò)服務(wù)的方法、裝置和系統(tǒng)
- 氫鹵化氟代烯烴的制造方法
- 基于國(guó)產(chǎn)平臺(tái)和X86平臺(tái)的異構(gòu)資源池管理方法及系統(tǒng)
- 一種生產(chǎn)系列高純度異構(gòu)烷烴的方法
- 一種異構(gòu)編譯算法可行性評(píng)估方法及系統(tǒng)
- 一種異構(gòu)執(zhí)行體的構(gòu)造方法及系統(tǒng)
- 面向邊緣計(jì)算云中心的擬態(tài)防御構(gòu)建方法及系統(tǒng)
- 異構(gòu)數(shù)據(jù)處理方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 異構(gòu)互連的仿真系統(tǒng)、方法、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





