[發(fā)明專利]應(yīng)用于行人姿勢分類的3D人體模型有效
| 申請?zhí)枺?/td> | 201310714502.6 | 申請日: | 2013-12-20 |
| 公開(公告)號: | CN103886315A | 公開(公告)日: | 2014-06-25 |
| 發(fā)明(設(shè)計)人: | B·海斯勒 | 申請(專利權(quán))人: | 本田技研工業(yè)株式會社 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/00 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應(yīng)用于 行人 姿勢 分類 人體模型 | ||
相關(guān)申請
本申請要求2012年12月21日遞交的第61/745,235號美國臨時申請的權(quán)益,其通過引用的方式全部并入于此。
技術(shù)領(lǐng)域
本發(fā)明總體涉及對象分類的領(lǐng)域,并且更具體地涉及在對行人姿勢的分類中對合成數(shù)據(jù)的使用。
背景技術(shù)
配備有行人檢測系統(tǒng)的車輛(例如汽車)可以警告其司機附近有行人。然而,僅僅有行人檢測是不夠的。情勢的危險也應(yīng)當(dāng)被評估。只有當(dāng)存在事故的風(fēng)險時才應(yīng)當(dāng)被產(chǎn)生警告。否則,司機將被不必要地分散注意力。情勢的危險例如與行人是否可能走入車輛的路徑有關(guān)。
“對象分類”指自動對視頻圖像或靜態(tài)圖像中的對象進行分類的操作。例如,分類系統(tǒng)可以確定靜態(tài)圖像中的人(例如行人)正在面向左、面向右、面向前還是面向后。可以例如在車輛中使用行人姿勢分類以提高車輛的司機、行人、騎車者以及與車輛共享道路的任何其它人的安全性。
當(dāng)前的對象分類系統(tǒng)存在很多問題。一個問題是缺少用于訓(xùn)練對象分類模型的大規(guī)模的訓(xùn)練集。為機器學(xué)習(xí)算法提供包括正樣本(包括特定類別的對象的圖像)和負樣本(不包括該特定類別的對象的圖像,例如包括另一類別的對象的圖像)的訓(xùn)練集以產(chǎn)生對象分類模型。
此外,當(dāng)為特定類型的對象生成新的訓(xùn)練集時,每個圖像利用特定的信息片段被人工注釋。例如,圖像中存在的對象的分類和/或圖像中存在的對象的特定參數(shù)(例如圖像內(nèi)的對象的顏色和對象的位置)可以被添加到圖像中。機器學(xué)習(xí)算法利用那些注釋和圖像來生成用于對對象進行分類的模型。注釋過程可能是乏味且耗時的。
發(fā)明內(nèi)容
以上及其它問題通過一種用于訓(xùn)練行人姿勢分類模型的方法、非瞬態(tài)計算機可讀存儲介質(zhì)和系統(tǒng)來解決。該方法的實施例包括接收行人的三維(3D)模型。該方法還包括接收指示如何生成行人的圖像的圖像參數(shù)的集合。該方法還包括基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。該方法還包括利用圖像參數(shù)的集合對所生成的合成圖像進行注釋。該方法還包括通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
該介質(zhì)的實施例存儲用于訓(xùn)練行人姿勢分類模型的可執(zhí)行指令。該指令接收行人的三維(3D)模型。該指令還接收指示如何生成行人的圖像的圖像參數(shù)的集合。該指令還基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。該指令還利用圖像參數(shù)的集合對所生成的合成圖像進行注釋。該指令還通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
該系統(tǒng)的實施例包括存儲可執(zhí)行指令的非瞬態(tài)計算機可讀存儲介質(zhì)。該指令接收行人的三維(3D)模型。該指令還接收指示如何生成行人的圖像的圖像參數(shù)的集合。該指令還基于接收的3D模型和接收的圖像參數(shù)的集合來生成二維(2D)合成圖像。該指令還利用圖像參數(shù)的集合對所生成的合成圖像進行注釋。該指令還通過經(jīng)注釋的合成圖像訓(xùn)練多個行人姿勢分類器。
說明書中所描述的特征和優(yōu)點并非無所不包的,并且具體而言,很多附加的特征和優(yōu)點對于本領(lǐng)域技術(shù)人員來說在考慮到附圖、說明書和權(quán)利要求的情況下是顯而易見的。此外,應(yīng)當(dāng)注意說明書中所使用的語言主要為了可讀性和指導(dǎo)性的目的而被選擇,并且可以不被選擇用來描述或者限定發(fā)明主題。
附圖說明
圖1是示出了根據(jù)實施例的行人姿勢分類系統(tǒng)的高級框圖。
圖2是示出了根據(jù)實施例的被用作圖1中所示的行人姿勢分類系統(tǒng)的計算機的示例的高級框圖。
圖3A是示出了根據(jù)實施例的圖1中所示的圖像生成模塊的詳細視圖的高級框圖。
圖3B是示出了根據(jù)實施例的圖1中所示的總體分類模塊的詳細視圖的高級框圖。
圖4A是示出了根據(jù)實施例的用于生成合成行人數(shù)據(jù)的方法的流程圖。
圖4B是示出了根據(jù)實施例的用于訓(xùn)練多個二元行人姿勢分類器以用于在圖3B中所示的總體分類模塊中使用的方法的流程圖。
圖4C是示出了根據(jù)實施例的用于對靜態(tài)圖像中的行人的姿勢進行分類的方法的流程圖。
附圖為了圖示的目的而示出了實施例的各種實現(xiàn)方式。本領(lǐng)域技術(shù)人員根據(jù)以下的討論將很容易地意識到可以使用這里所示出的結(jié)構(gòu)和方法的替代實施例而不偏離這里所描述的實施例的原理。
具體實施方式
現(xiàn)在參考附圖描述實施例,其中相似的標號指示相同或功能相似的元件。此外,在附圖中,每個標號最左邊的數(shù)字對應(yīng)于其中該標號第一次被使用的附圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于本田技研工業(yè)株式會社,未經(jīng)本田技研工業(yè)株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310714502.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





