[發(fā)明專利]一種基于飛機3d模型的飛機檢測方法在審
| 申請?zhí)枺?/td> | 202011040774.9 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112200227A | 公開(公告)日: | 2021-01-08 |
| 發(fā)明(設計)人: | 李愛林;黃濤;文戈;其他發(fā)明人請求不公開姓名 | 申請(專利權)人: | 深圳市華付信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00 |
| 代理公司: | 北京科家知識產(chǎn)權代理事務所(普通合伙) 11427 | 代理人: | 宮建華 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 飛機 模型 檢測 方法 | ||
1.一種基于飛機3d模型的飛機檢測方法,其特征在于,包括以下步驟:
步驟一:打開飛機3d模型,得到不同角度、帶飛機掩碼的飛機本體截圖;
步驟二:生成逼真飛機圖片;將背景圖片統(tǒng)一設置為固定大小,然后隨機選取圖片范圍內(nèi)的一個點,作為飛機粘貼的左上角,選擇一張帶掩碼的飛機截圖,根據(jù)掩碼得到飛機的外接矩形,再根據(jù)外接矩形摳取飛機,接著對飛機設置一個大小,最后使用PIL庫的paste函數(shù),根據(jù)飛機截圖的掩碼,將飛機粘貼到背景圖片選取的點上,得到逼真飛機圖片的同時,生成圖片中飛機的框信息;
步驟三:步驟二中生成的飛機圖片和其對應的框信息,與真實應用場景的飛機和框信息,構成了深度學習的訓練集,并程序化地生成飛機數(shù)據(jù),再加上真實應用場景的數(shù)據(jù),可以得到可用于飛機檢測訓練的數(shù)據(jù);
步驟四:模擬各種天氣狀況下的飛機圖片,取一張訓練集中的圖片,再取一張黑夜、雨雪等天氣的圖片并保存為與訓練集中圖片相同的分辨率,兩張圖片按1比1的權重相加,也就是兩張圖片相同位置上的像素,分別成乘以0.5,然后相加,就得到模擬圖片,按照此流程生成的模擬圖片,再對應上飛機框信息,就可以加入到訓練集中;
步驟五:訓練深度學習模型:將上述生成的飛機圖片、模擬各種天氣狀況下的飛機圖片、少量真實的飛機圖片,以及這些圖片對應的飛機框,輸入到神經(jīng)網(wǎng)絡進行合理訓練,就可以得到深度學習模型。
2.根據(jù)權利要求1所述的一種基于飛機3d模型的飛機檢測方法,其特征在于:所述步驟一的具體步驟為:
(1)使用三維看圖軟件打開飛機3d模型文件;
(2)直接渲染得到不同角度、帶飛機掩碼的飛機本體截圖,所述截圖為RGBA格式的PNG圖片,其中飛機掩碼是RGBA格式中的A(alpha)層,代表著每個像素點的不透明程度,實質(zhì)為二值圖,為0表示透明,為1表示不透明,此處飛機的掩碼就是:飛機截圖中背景像素點的A層就為0,飛機像素點的A層就為1。
3.根據(jù)權利要求1所述的一種基于飛機3d模型的飛機檢測方法,其特征在于:所述步驟一的具體步驟為:
(1)通過在線查看3d模型的網(wǎng)站打開3d模型文件;
(2)一邊轉(zhuǎn)動飛機,一邊錄屏,得到視頻文件后抽幀,得到不同角度的飛機截圖;
(3)使用opencv庫得到每張飛機截圖的掩碼。
4.根據(jù)權利要求1所述的一種基于飛機3d模型的飛機檢測方法,其特征在于:所述步驟二中,所述背景圖片為高清壁紙圖片、高分辨率圖片、真實應用場景圖片中的一種或多種。
5.根據(jù)權利要求1所述的一種基于飛機3d模型的飛機檢測方法,其特征在于:所述步驟二中,背景圖片的大小為512*512像素。
6.根據(jù)權利要求1所述的一種基于飛機3d模型的飛機檢測方法,其特征在于:所述步驟二中,框信息包括:左上角的橫坐標、縱坐標和飛機的寬、高。
7.根據(jù)權利要求1所述的一種基于飛機3d模型的飛機檢測方法,其特征在于:所述步驟三中,真實應用場景的數(shù)量為每個攝像頭100張。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市華付信息技術有限公司,未經(jīng)深圳市華付信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011040774.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





