[發(fā)明專利]基于三元組聚焦損失函數(shù)的行人再識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810738336.6 | 申請(qǐng)日: | 2018-07-06 |
| 公開(kāi)(公告)號(hào): | CN109190446A | 公開(kāi)(公告)日: | 2019-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 張世周;張艷寧;張琦;夏勇 | 申請(qǐng)(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 西北工業(yè)大學(xué)專利中心 61204 | 代理人: | 常威威 |
| 地址: | 710072 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聚焦損失 三元組 特征提取 網(wǎng)絡(luò)模型 圖像 計(jì)算特征向量 圖像數(shù)據(jù)集 分組 大小判斷 模型訓(xùn)練 歐式距離 識(shí)別性能 損失函數(shù) 行人識(shí)別 訓(xùn)練數(shù)據(jù) 收斂性 樣本 數(shù)據(jù)庫(kù) 網(wǎng)絡(luò) 聚焦 查詢 | ||
1.一種基于三元組聚焦損失函數(shù)的行人再識(shí)別方法,其特征在于步驟如下:
步驟1:假設(shè)訓(xùn)練數(shù)據(jù)集中有N幅圖像,將圖像分組,每組訓(xùn)練數(shù)據(jù)隨機(jī)挑選P個(gè)不同的行人,每個(gè)行人隨機(jī)選K幅不同的圖像,即一組訓(xùn)練數(shù)據(jù)包含P×K幅圖像,對(duì)于每組訓(xùn)練數(shù)據(jù)中的每一幅圖像,其本身為原樣本,和原樣本是相同行人的圖像為正樣本,和原樣本是不同行人的圖像為負(fù)樣本,原樣本、正樣本和負(fù)樣本共同構(gòu)成一個(gè)三元組;其中,P的取值范圍為25-35,K的取值范圍為2-5;
步驟2:選擇殘差網(wǎng)絡(luò)Resnet50為用于特征提取的卷積神經(jīng)網(wǎng)絡(luò),并設(shè)置網(wǎng)絡(luò)的損失函數(shù)為以下三元組聚焦損失函數(shù):
其中,LTFL表示損失函數(shù),表示原樣本與所有正樣本之間的最大歐式距離,表示原樣本與所有負(fù)樣本之間的最小歐式距離,σ表示高斯核空間映射參數(shù),σ=0.3,m表示人為設(shè)定的閾值參數(shù),m=0.3;
步驟3:將步驟1中得到的每組訓(xùn)練數(shù)據(jù)集分別輸入步驟2的卷積神經(jīng)網(wǎng)絡(luò),并設(shè)置訓(xùn)練次數(shù)為300,學(xué)習(xí)率為2×10-4,采用隨機(jī)梯度下降法進(jìn)行訓(xùn)練,得到訓(xùn)練好的網(wǎng)絡(luò)模型;
步驟4:先利用訓(xùn)練好的網(wǎng)絡(luò)模型對(duì)數(shù)據(jù)庫(kù)中的所有圖像進(jìn)行特征提取,得到每幅圖像的特征向量,利用訓(xùn)練好的網(wǎng)絡(luò)模型對(duì)待查詢行人圖像進(jìn)行特征提取,得到其特征向量;然后,計(jì)算待查詢行人圖像的特征向量和數(shù)據(jù)庫(kù)中每幅圖像的特征向量之間的歐式距離,并且按照歐式距離值從小到大對(duì)數(shù)據(jù)庫(kù)中對(duì)應(yīng)的圖像進(jìn)行排序,距離越近表示與待查詢行人圖像是同一個(gè)行人的可能性越大。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810738336.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種超能聚焦發(fā)射器
- 用于近眼顯示器的顯示更新時(shí)間縮減
- 一種在FCN中引入聚焦機(jī)制對(duì)靜態(tài)人體圖像進(jìn)行分割的方法
- 一種基于焦點(diǎn)損失函數(shù)的自然場(chǎng)景下文字檢測(cè)定位方法和裝置
- 基于三元組聚焦損失函數(shù)的行人再識(shí)別方法
- 基于最優(yōu)空時(shí)聚焦技術(shù)的聲學(xué)覆蓋層插入損失測(cè)量方法
- 信息搜索方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于時(shí)閾聚焦圖網(wǎng)絡(luò)的NAFLD超聲視頻分類方法
- 激光耦合裝置
- 基于深度學(xué)習(xí)的SAR自聚焦方法
- 一種保護(hù)敏感資源描述框架數(shù)據(jù)的方法、裝置及系統(tǒng)
- 一種存儲(chǔ)資源描述框架數(shù)據(jù)的方法和裝置
- 采用知識(shí)圖譜推薦供求信息的方法和裝置
- 知識(shí)圖譜表示學(xué)習(xí)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 三元組獲取方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 語(yǔ)義行業(yè)術(shù)語(yǔ)
- 基于碎片化知識(shí)下的卷積嵌入表示推理方法
- 三元組預(yù)測(cè)模型生成方法、關(guān)系三元組提取方法和裝置
- 基于結(jié)構(gòu)化上下文信息的知識(shí)圖譜預(yù)訓(xùn)練方法
- 一種結(jié)合命名實(shí)體識(shí)別的開(kāi)放域信息抽取方法
- 腦網(wǎng)絡(luò)模型建立方法
- 弱光圖像增強(qiáng)方法及裝置
- 模型訓(xùn)練方法及裝置
- 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型搜索方法、裝置及存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型搜索方法、裝置以及電子設(shè)備
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 多視角的網(wǎng)絡(luò)攻防仿真系統(tǒng)
- 一種多模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 一種神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





