[發(fā)明專利]一種基于可視化編譯器的人物和姿勢(shì)檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710103927.1 | 申請(qǐng)日: | 2017-02-24 |
| 公開(公告)號(hào): | CN106897697A | 公開(公告)日: | 2017-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 夏春秋 | 申請(qǐng)(專利權(quán))人: | 深圳市唯特視科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術(shù)產(chǎn)業(yè)園*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 可視化 編譯器 人物 姿勢(shì) 檢測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及人物姿勢(shì)檢測(cè)領(lǐng)域,尤其是涉及了一種基于可視化編譯器的人物和姿勢(shì)檢測(cè)方法。
背景技術(shù)
人體動(dòng)作姿勢(shì)的檢測(cè)在視頻監(jiān)控、虛擬現(xiàn)實(shí)、人際智能交互等領(lǐng)域的廣泛應(yīng)用而成為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn),其可以用于公共場(chǎng)合的智能監(jiān)控和人群中危險(xiǎn)姿勢(shì)的監(jiān)控等。雖然近年來國(guó)內(nèi)人體姿勢(shì)檢測(cè)的研究取得了重要進(jìn)展,但人體姿勢(shì)的高復(fù)雜性和多變化性使得識(shí)別的精確性和高效性并沒有完全滿足相關(guān)行業(yè)的使用要求。不同的光照、視角和背景等條件會(huì)使得人體行為在姿勢(shì)和特性上產(chǎn)生差異,此外人體自遮擋、部分遮擋、人體個(gè)體差異、多人物識(shí)別等都是人體姿勢(shì)檢測(cè)復(fù)雜性在空間上的體現(xiàn),所以人物和姿勢(shì)檢測(cè)方法需要進(jìn)一步研究。
本發(fā)明提出了一種基于可視化編譯器的人物和姿勢(shì)檢測(cè)方法,先用場(chǎng)景描述作為可視化編譯器的輸入,用標(biāo)定好的真實(shí)數(shù)據(jù)注釋來訓(xùn)練行人檢測(cè)系統(tǒng)和姿態(tài)估計(jì)系統(tǒng),再通過合成數(shù)據(jù)學(xué)習(xí)網(wǎng)絡(luò);接著使用剩余模塊和空間置信模塊這兩個(gè)基本單位來定義網(wǎng)絡(luò),最后用姿勢(shì)網(wǎng)絡(luò)定位行人。本發(fā)明可以自動(dòng)獲得檢測(cè)的注釋、身體部位位置和分割掩碼,通過使用攝像機(jī)來對(duì)行人進(jìn)行定位,估計(jì)其姿勢(shì)并進(jìn)行活動(dòng)分析;減少了光照、遮擋等對(duì)檢測(cè)的影響,有效地提高了識(shí)別效率。
發(fā)明內(nèi)容
針對(duì)光照、遮擋等會(huì)產(chǎn)生影響的問題,本發(fā)明的目的在于提供一種基于可視化編譯器的人物和姿勢(shì)檢測(cè)方法,先用場(chǎng)景描述作為可視化編譯器的輸入,用標(biāo)定好的真實(shí)數(shù)據(jù)注釋來訓(xùn)練行人檢測(cè)系統(tǒng)和姿態(tài)估計(jì)系統(tǒng),再通過合成數(shù)據(jù)學(xué)習(xí)網(wǎng)絡(luò);接著使用剩余模塊和空間置信模塊這兩個(gè)基本單位來定義網(wǎng)絡(luò),最后用姿勢(shì)網(wǎng)絡(luò)定位行人。
為解決上述問題,本發(fā)明提供一種基于可視化編譯器的人物和姿勢(shì)檢測(cè)方法,其主要內(nèi)容包括:
(一)場(chǎng)景描述的數(shù)據(jù)合成;
(二)通過合成數(shù)據(jù)學(xué)習(xí)網(wǎng)絡(luò);
(三)采用基本塊定義網(wǎng)絡(luò);
(四)姿勢(shì)網(wǎng)絡(luò)(Pose Net)聯(lián)合定位。
其中,所述的可視化編譯器,用于生成場(chǎng)景特定的人類檢測(cè)和姿態(tài)估計(jì)系統(tǒng);其已知信息有:
(1)相機(jī)的內(nèi)在參數(shù)和外在參數(shù);
(2)場(chǎng)景粗略的物理幾何布局(行走、坐著、站立)和可能被遮擋(障礙)或物理上不存在的區(qū)域(墻)的場(chǎng)景區(qū)域;
(3)場(chǎng)景各個(gè)區(qū)域行人的姿勢(shì)和方向;
與單個(gè)圖像一起,場(chǎng)景描述作為編譯器的輸入,在場(chǎng)景的有效區(qū)域中合成物理上接地和幾何上精確的人;編譯器學(xué)習(xí)區(qū)域特定模型的集合,用于人的檢測(cè)、姿態(tài)估計(jì)和分割;在推理期間,這些特定模型中的每一個(gè)區(qū)域在其對(duì)應(yīng)的區(qū)域上同時(shí)運(yùn)行。
其中,所述的場(chǎng)景描述的數(shù)據(jù)合成,需要高質(zhì)量的標(biāo)定好的真實(shí)數(shù)據(jù)注釋來訓(xùn)練行人檢測(cè)系統(tǒng)和姿態(tài)估計(jì)系統(tǒng);無需復(fù)雜的人工手動(dòng)標(biāo)記過程,可視化編譯器使用場(chǎng)景描述模擬適用于場(chǎng)景每個(gè)區(qū)域的行人外觀,從而擴(kuò)展到大量場(chǎng)景中。
進(jìn)一步地,所述的場(chǎng)景描述,給定場(chǎng)景描述,編譯器首先生成場(chǎng)景的平面3D模型來包圍障礙物,即擬合地平面,平面壁和立方體;然后使用相機(jī)參數(shù)來考慮相機(jī)鏡頭特性(例如,廣角相機(jī)中的透視失真)和用于渲染幾何精確的人的場(chǎng)景;除了在場(chǎng)景的每個(gè)“有效行人位置”呈現(xiàn)人的外觀之外,渲染管道還可以精確地控制人類外觀的變化,如性別、高度、寬度、取向和姿態(tài);虛擬人類數(shù)據(jù)庫(kù)包括139個(gè)不同的模型,涵蓋性別、服裝顏色和種族;編譯器可從0度到360度,也可以由任何先前的可用信息引導(dǎo);
為了給渲染圖像中的人生成標(biāo)定好的真實(shí)數(shù)據(jù)標(biāo)記,首先使用以下標(biāo)簽將屬性關(guān)聯(lián)到每個(gè)3D虛擬模型:分割掩碼27個(gè)部分的3D位置以及用于檢測(cè)的人的中心位置;然后從3D注釋和相機(jī)投影參數(shù)自動(dòng)提取用于訓(xùn)練的2D標(biāo)簽,這個(gè)過程允許生成一致的無噪聲標(biāo)簽;此外,還可以均勻地跨越所有的外觀、方向、姿勢(shì)或位置的變化。
其中,所述的通過合成數(shù)據(jù)學(xué)習(xí)網(wǎng)絡(luò),使用產(chǎn)生的場(chǎng)景特定數(shù)據(jù),可視化編譯器產(chǎn)生深度神經(jīng)網(wǎng)絡(luò)形式的可視化程序,根據(jù)場(chǎng)景描述的規(guī)范操作訓(xùn)練;
由可視化編譯器生成的可視化程序共同完成以下任務(wù):行人的本地化,定義其姿勢(shì)的界標(biāo),并分割定義它們的像素;為了預(yù)測(cè)行人位置、姿態(tài)和分割掩模,網(wǎng)絡(luò)必須對(duì)行人的全貌,地標(biāo)的局部外觀以及這些部件的有效空間配置之前的模型進(jìn)行建模;為了捕獲外觀、完整的行人和當(dāng)?shù)氐貥?biāo)外觀,學(xué)習(xí)將RGB輸入映射用于行人、局部地標(biāo)和分割掩碼的精確定位的熱圖回歸問題;通過空間置信(SB)模塊學(xué)習(xí)部件位置之間的空間關(guān)系上的先驗(yàn),空間置信模塊考慮行人、局部地標(biāo)和分割掩碼的熱圖之間的相關(guān)性;將這種可視化程序的特定實(shí)例化稱為姿勢(shì)網(wǎng)絡(luò)(Pose Net)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市唯特視科技有限公司,未經(jīng)深圳市唯特視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710103927.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)可視化模型的處理方法及裝置
- 一種可視化內(nèi)容分發(fā)方法及系統(tǒng)
- 數(shù)據(jù)可視化圖形快速應(yīng)用方法及系統(tǒng)
- 基于有效信息的流場(chǎng)可視化視圖量化方法
- 可視化報(bào)表的制作方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種可視化圖形快速應(yīng)用與傳輸?shù)姆椒跋到y(tǒng)
- 一種可視化數(shù)據(jù)模型編排系統(tǒng)和編排方法
- 一種供水行業(yè)機(jī)房3D可視化運(yùn)維管理系統(tǒng)
- 一種電網(wǎng)數(shù)據(jù)可視化方法、裝置、設(shè)備及介質(zhì)
- 一種大場(chǎng)景城市建筑實(shí)時(shí)三維可視化的方法
- 呈現(xiàn)人物關(guān)系的方法及裝置
- 一種人臉識(shí)別安防考勤系統(tǒng)
- 一種用于人物關(guān)系抽取的方法和裝置
- 基于移動(dòng)終端的人物識(shí)別提醒系統(tǒng)及方法
- 智能游戲人物識(shí)別裝置、系統(tǒng)及方法
- 一種多視頻的目標(biāo)搜索方法、裝置及設(shè)備
- 基于社交網(wǎng)絡(luò)大數(shù)據(jù)的人物畫像模型構(gòu)建方法
- 一種人數(shù)分析統(tǒng)計(jì)方法及系統(tǒng)
- 查找目標(biāo)人物的方法、裝置、終端和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 進(jìn)行人物聚類的方法、裝置、服務(wù)器和存儲(chǔ)介質(zhì)





