[發(fā)明專利]適于大景深的人群特征識別網(wǎng)絡(luò)構(gòu)建及訓(xùn)練方法在審
| 申請?zhí)枺?/td> | 202011484694.2 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112633106A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設(shè)計)人: | 田青;唐紹鵬 | 申請(專利權(quán))人: | 蘇州玖合智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京科闊知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32400 | 代理人: | 蘇興建 |
| 地址: | 215131 江蘇省蘇州市相城經(jīng)濟(jì)技術(shù)開發(fā)區(qū)*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 適于 景深 人群 特征 識別 網(wǎng)絡(luò) 構(gòu)建 訓(xùn)練 方法 | ||
1.一種適于大景深的人群特征識別網(wǎng)絡(luò)構(gòu)建及訓(xùn)練方法,其特征是
所述人群特征識別網(wǎng)絡(luò)包括:
網(wǎng)絡(luò)前端:前端網(wǎng)絡(luò)采用剔除了全連接層的VGG-16網(wǎng)絡(luò),并且采用3×3的卷積核;
上采樣層:前端的VGG-16網(wǎng)絡(luò)中,進(jìn)行了三次最大池化,用以降低特征圖的分辨率;
網(wǎng)絡(luò)后端:后端網(wǎng)絡(luò)為三層分支網(wǎng)絡(luò),它們分別采用空洞率為2和3的空洞卷積,空洞卷積的定義如下:
其中:x(m,n)是長寬分別為M和N的輸入圖像信息,經(jīng)過卷積核w(i,j)得到空洞卷積的輸出y(m,n);參數(shù)r表示空洞率;如果r=1,則空洞卷積是普通卷積;
所述人群特征網(wǎng)絡(luò)的訓(xùn)練步驟包括:
1)生成密度圖:
采用脈沖函數(shù)卷積高斯核的方式來定義密度圖;
假設(shè)標(biāo)注點的位置為xi,則具有N個頭的標(biāo)簽設(shè)為H(x);如果假設(shè)在一個人頭區(qū)域的周圍,人群的密度是均勻的,它的最近鄰給出了一個對于幾何形變的合理的估計;
為了使得密度圖能夠更好地與不同視角且人群很密的圖像對應(yīng)起來,使用幾何適應(yīng)高斯核的密度圖;對于每一個人頭的位置點xi,給出了多個近鄰距離的平均值di,與xi相關(guān)的像素對應(yīng)于場景中地面上的一個區(qū)域,這個區(qū)域的半徑與di成正比;為了估計xi周圍的人群密度,則把H(x)卷積一個自適應(yīng)的高斯核,這個高斯核的方差σi是可變的并且和di成比例;
2)損失函數(shù)
在訓(xùn)練期間,隨機(jī)梯度下降的學(xué)習(xí)率固定為1e-6;
采用歐氏距離測量生成的密度圖與真實值的距離;使用分塊計算損失函數(shù)的方法,將高密度區(qū)域和低密度區(qū)域分別計算損失以減少誤差;
3)評估標(biāo)準(zhǔn)
評估人群密度估計模型時,采用均方誤差MSE和平均絕對誤差MAE,MSE用來描述模型的準(zhǔn)確度,MSE越小則準(zhǔn)確度越高,MAE能反映出預(yù)測值的誤差情況。
2.根據(jù)權(quán)利要求1所述的適于大景深的人群特征識別網(wǎng)絡(luò)構(gòu)建及訓(xùn)練方法,其特征是所述網(wǎng)絡(luò)前端的VGG-16網(wǎng)絡(luò)采用10層卷積層和3層池化層的組合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州玖合智能科技有限公司,未經(jīng)蘇州玖合智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011484694.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





