[發(fā)明專利]應(yīng)用于行人姿勢分類的3D人體模型有效

申請?zhí)枺?/td>	201310714502.6	申請日：	2013-12-20
公開（公告）號：	CN103886315A	公開（公告）日：	2014-06-25
發(fā)明（設(shè)計）人：	B·海斯勒	申請（專利權(quán)）人：	本田技研工業(yè)株式會社
主分類號：	G06K9/46	分類號：	G06K9/46;G06K9/00
代理公司：	北京市金杜律師事務(wù)所 11256	代理人：	王茂華
地址：	日本***	國省代碼：	日本;JP
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	應(yīng)用于行人姿勢分類人體模型
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

相關(guān)申請

本申請要求2012年12月21日遞交的第61/745,235號美國臨時申請的權(quán)益，其通過引用的方式全部并入于此。

技術(shù)領(lǐng)域

本發(fā)明總體涉及對象分類的領(lǐng)域，并且更具體地涉及在對行人姿勢的分類中對合成數(shù)據(jù)的使用。

背景技術(shù)

配備有行人檢測系統(tǒng)的車輛（例如汽車）可以警告其司機附近有行人。然而，僅僅有行人檢測是不夠的。情勢的危險也應(yīng)當(dāng)被評估。只有當(dāng)存在事故的風(fēng)險時才應(yīng)當(dāng)被產(chǎn)生警告。否則，司機將被不必要地分散注意力。情勢的危險例如與行人是否可能走入車輛的路徑有關(guān)。

“對象分類”指自動對視頻圖像或靜態(tài)圖像中的對象進行分類的操作。例如，分類系統(tǒng)可以確定靜態(tài)圖像中的人（例如行人）正在面向左、面向右、面向前還是面向后。可以例如在車輛中使用行人姿勢分類以提高車輛的司機、行人、騎車者以及與車輛共享道路的任何其它人的安全性。

當(dāng)前的對象分類系統(tǒng)存在很多問題。一個問題是缺少用于訓(xùn)練對象分類模型的大規(guī)模的訓(xùn)練集。為機器學(xué)習(xí)算法提供包括正樣本（包括特定類別的對象的圖像）和負樣本（不包括該特定類別的對象的圖像，例如包括另一類別的對象的圖像）的訓(xùn)練集以產(chǎn)生對象分類模型。

此外，當(dāng)為特定類型的對象生成新的訓(xùn)練集時，每個圖像利用特定的信息片段被人工注釋。例如，圖像中存在的對象的分類和/或圖像中存在的對象的特定參數(shù)（例如圖像內(nèi)的對象的顏色和對象的位置）可以被添加到圖像中。機器學(xué)習(xí)算法利用那些注釋和圖像來生成用于對對象進行分類的模型。注釋過程可能是乏味且耗時的。

發(fā)明內(nèi)容

以上及其它問題通過一種用于訓(xùn)練行人姿勢分類模型的方法、非瞬態(tài)計算機可讀存儲介質(zhì)和系統(tǒng)來解決。該方法的實施例包括接收行人的三維（3D）模型。該方法還包括接收指示如何生成行人的圖像的圖像參數(shù)的集合。該方法還包括基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維（2D）合成圖像。該方法還包括利用圖像參數(shù)的集合對所生成的合成圖像進行注釋。該方法還包括通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。

該介質(zhì)的實施例存儲用于訓(xùn)練行人姿勢分類模型的可執(zhí)行指令。該指令接收行人的三維（3D）模型。該指令還接收指示如何生成行人的圖像的圖像參數(shù)的集合。該指令還基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維（2D）合成圖像。該指令還利用圖像參數(shù)的集合對所生成的合成圖像進行注釋。該指令還通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。

該系統(tǒng)的實施例包括存儲可執(zhí)行指令的非瞬態(tài)計算機可讀存儲介質(zhì)。該指令接收行人的三維（3D）模型。該指令還接收指示如何生成行人的圖像的圖像參數(shù)的集合。該指令還基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維（2D）合成圖像。該指令還利用圖像參數(shù)的集合對所生成的合成圖像進行注釋。該指令還通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。

說明書中所描述的特征和優(yōu)點并非無所不包的，并且具體而言，很多附加的特征和優(yōu)點對于本領(lǐng)域技術(shù)人員來說在考慮到附圖、說明書和權(quán)利要求的情況下是顯而易見的。此外，應(yīng)當(dāng)注意說明書中所使用的語言主要為了可讀性和指導(dǎo)性的目的而被選擇，并且可以不被選擇用來描述或者限定發(fā)明主題。

附圖說明

圖1是示出了根據(jù)實施例的行人姿勢分類系統(tǒng)的高級框圖。

圖2是示出了根據(jù)實施例的被用作圖1中所示的行人姿勢分類系統(tǒng)的計算機的示例的高級框圖。

圖3A是示出了根據(jù)實施例的圖1中所示的圖像生成模塊的詳細視圖的高級框圖。

圖3B是示出了根據(jù)實施例的圖1中所示的總體分類模塊的詳細視圖的高級框圖。

圖4A是示出了根據(jù)實施例的用于生成合成行人數(shù)據(jù)的方法的流程圖。

圖4B是示出了根據(jù)實施例的用于訓(xùn)練多個二元行人姿勢分類器以用于在圖3B中所示的總體分類模塊中使用的方法的流程圖。

圖4C是示出了根據(jù)實施例的用于對靜態(tài)圖像中的行人的姿勢進行分類的方法的流程圖。

附圖為了圖示的目的而示出了實施例的各種實現(xiàn)方式。本領(lǐng)域技術(shù)人員根據(jù)以下的討論將很容易地意識到可以使用這里所示出的結(jié)構(gòu)和方法的替代實施例而不偏離這里所描述的實施例的原理。

具體實施方式

現(xiàn)在參考附圖描述實施例，其中相似的標號指示相同或功能相似的元件。此外，在附圖中，每個標號最左邊的數(shù)字對應(yīng)于其中該標號第一次被使用的附圖。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于本田技研工業(yè)株式會社，未經(jīng)本田技研工業(yè)株式會社許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310714502.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：照明車用燈具轉(zhuǎn)動結(jié)構(gòu)
下一篇：一種集裝箱式變電站的功能間隔

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】