[發(fā)明專利]一種進行人物重標記的自步-協(xié)同訓練學習方法有效
| 申請?zhí)枺?/td> | 201710413595.7 | 申請日: | 2017-06-05 |
| 公開(公告)號: | CN107463996B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設計)人: | 孟德宇;謝琦;馬凡;李梓娜;趙謙 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 北京睿智保誠專利代理事務所(普通合伙) 11732 | 代理人: | 周新楣 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 進行 人物 標記 協(xié)同 訓練 學習方法 | ||
1.在Market-1501數(shù)據(jù)集上進行人物重標記的自步-協(xié)同訓練學習方法,所述Market-1501數(shù)據(jù)集包括1501個人的32668張照片,每個人的照片最多被六個照相機捕獲,最少被兩個照相機捕獲,選取包含751個人的12936張經(jīng)過剪裁的照片作訓練數(shù)據(jù)集,包含750個人的19732張經(jīng)過剪裁的照片作為測試數(shù)據(jù)集,所述人物重標記是指,對于某個被攝像頭捕獲的人物,要確定在其他攝像頭中該人物是否被捕獲,其特征在于,包括如下步驟:
步驟S1:獲取目標領域兩個視野下的標注數(shù)據(jù)集和無標注數(shù)據(jù)集,其中,對于要進行身份標記的某個人物,將含有該人物的圖片標記為正類,否則標記為負類,多視野標記數(shù)據(jù),在每類中隨機選取20%的數(shù)據(jù)作為標注數(shù)據(jù),剩下的數(shù)據(jù)作為無標注數(shù)據(jù);
步驟S2:確定兩個視野下的優(yōu)化目標;
步驟S3:給兩個視野的損失函數(shù)分別嵌入自步學習機制;
步驟S4:根據(jù)同一樣本在兩個視野下的相似性,引入兩個視野關聯(lián)的自步正則項;
步驟S5:結合步驟S2、S3及S4,構建嵌入穩(wěn)健機制的多視野半監(jiān)督學習模型,稱作自步-協(xié)同訓練模型;
步驟S6:以步驟S1獲得的兩個視野的全部數(shù)據(jù)為輸入,使用交替優(yōu)化算法求解步驟S5所構建的自步-協(xié)同訓練模型,最終獲得未標注數(shù)據(jù)的高質量標注及最終優(yōu)化的學習器;
其中,所述步驟S5中,結合步驟S2-S4,得到最終的自步協(xié)同訓練模型如下:
其中γ是控制視野相關程度的參數(shù),此值越大表示兩個視野的相關性越強,即在一個視野下被選作訓練數(shù)據(jù)的無標記樣本在另一視野下被選擇;
所述步驟S6用交替優(yōu)化算法求解步驟S5中的自步協(xié)同訓練模型步驟如下:
S1)初始化
首先取V(1)和V(2)為Ru中的零向量,設置λ(1),λ(2)為比較小的值,因此在第一步迭代時只選擇少量的未標記樣本做訓練樣例,γ設置為1;
兩個學習器同時在各自視野下的標記樣本上進行學習更新,預測未標記樣本的標注值,為了得到未標記樣本的可靠預測,其標注值是在兩個視野下的預測值的平均,接下來得到無標記數(shù)據(jù)在不同視野下的損失值;
S2)根據(jù)交替優(yōu)化算法對優(yōu)化變量進行更新
在一次迭代過程中,對于j=1,2,采用如下優(yōu)化順序:
其中k=l+1,…,l+u是樣本的角標;
S2.1)更新
該步驟的目的是進行第j個視野樣本的選擇,為第3-j個視野無標記樣本的選擇提供指導;
(2)式等價于求解以下的優(yōu)化問題:
其中是樣本在第j個視野下的損失值;
(6)式對求偏導,得到下式:
由此得到的更新公式如下:
根據(jù)(7)式在第j個視野下從未標記數(shù)據(jù)集中選擇可靠樣本,可靠樣本的權重偽標注的可信度越高,相應的樣本在此步驟更容易被挑選出來;
在第一次迭代且j=1時,所有的根據(jù)初始步驟設置為0,因此樣本選擇僅根據(jù)第一個視野中的損失信息,即損失值小于λ(1)的未標記樣本被認為是可信樣例,其他情況下根據(jù)當前視野的損失和另一視野的指導信息進行選擇;
S2.2)更新
該步驟的目的是更新第3-j個視野下的訓練數(shù)據(jù)集
(3)式等價于求解以下的優(yōu)化問題:
其中是樣本在第3-j個視野下的損失值;
(8)式對求偏導,可以得到下式:
由此得到的更新公式如下:
根據(jù)(9)式在第3-j個視野下從未標記數(shù)據(jù)集中選擇可靠樣本,可靠樣本的權重
該步選出的樣本將直接用于該視野下學習器的訓練;
S2.3)更新w(3-j)
(4)式等價于求解以下的優(yōu)化問題:
在標記數(shù)據(jù)和上一步挑選的偽標注數(shù)據(jù)上更新該視野下的分類器;
S2.4)更新yk
該步驟的目的是更新未標記樣本的偽標注
(5)式等價于以下的優(yōu)化問題:
以上優(yōu)化問題有全局最優(yōu)解,對第i個樣本,其標簽值yi是兩個視野下學習器預測值的加權求和;
S2.5)增大λ(j)
通過控制樣本個數(shù)的方法來增加每次循環(huán)中可信樣本的個數(shù);假設在初始化步驟中選擇的正負類樣本個數(shù)分別是a,b,那么在第k次執(zhí)行S2.4)之后,選擇的正負類樣本分別是a×k、b×k;
當無標記樣本全被選入訓練數(shù)據(jù)集或者預設的最大迭代步數(shù)達到之后,算法停止,此時得到所有未標記數(shù)據(jù)的高質量標簽和最終優(yōu)化的兩個學習器;
其中,w(j)是學習器的參數(shù);表示在訓練第j個視野下的學習器時,無標記樣本被選作訓練樣本,否則表示該樣本未選入訓練數(shù)據(jù)集;λ是自步正則參數(shù);λ(j)為在第j個視野下,控制樣本選擇的自步學習正則參數(shù);g(j)(x,w)是該視野下的學習器,l(·,·)是損失函數(shù),是第j個視野下第i個樣本的特征向量,其中,i=1,…,l+u;j=1,2;V(1),V(2)是u維的向量,分別表示在兩個視野下未標記樣本對應的權重;λ(1)為第1個視野下控制樣本選擇的自步學習正則參數(shù),λ(2)為第2個視野下控制樣本選擇的自步學習正則參數(shù);為在3-j個視野下樣本的權重;為在第3-j個視野下學習器的參數(shù);γ是控制視野相關程度的參數(shù);yk是未標記樣本的偽標注;l是標注數(shù)據(jù)集的樣本數(shù)目,u是無標注數(shù)據(jù)集的樣本數(shù)目。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經(jīng)西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710413595.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:整體臥式熱泵熱水機
- 下一篇:月餅包裝盒(珍月禮)
- 移動通信終端的協(xié)同方法及其界面系統(tǒng)
- 業(yè)務協(xié)同流程配置、業(yè)務協(xié)同方法及裝置
- 一種基于健康檔案共享平臺的跨醫(yī)院協(xié)同檢查信息系統(tǒng)
- 一種協(xié)同控制方法、協(xié)同控制系統(tǒng)及變頻器
- 基于協(xié)同網(wǎng)關的跨域協(xié)同交互方法
- 一種生產(chǎn)協(xié)同管理方法及系統(tǒng)
- 云邊協(xié)同方法、裝置、系統(tǒng)、設備和介質
- 一種智能辦公協(xié)同操作方法及系統(tǒng)
- 一種用于無人裝備的時間協(xié)同航跡規(guī)劃方法
- 基于大數(shù)據(jù)的智慧辦公協(xié)同方法及系統(tǒng)





