[發明專利]自動創建人工智能圖像識別訓練素材與標注文件的方法有效
| 申請號: | 201810325982.X | 申請日: | 2018-04-12 |
| 公開(公告)號: | CN108563742B | 公開(公告)日: | 2022-02-01 |
| 發明(設計)人: | 王海軍;王海濤;呂博鈺;呂鋼 | 申請(專利權)人: | 王海軍 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58 |
| 代理公司: | 貴州啟辰知識產權代理有限公司 52108 | 代理人: | 趙彥棟 |
| 地址: | 817000 青海省海西蒙古族藏*** | 國省代碼: | 青海;63 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 創建 人工智能 圖像 識別 訓練 素材 標注 文件 方法 | ||
本發明公開自動創建人工智能圖像識別訓練素材與標注文件的方法,其特征在于,該方法包括以下步驟:步驟S1:3D模型與場景設計,利用CAD類軟件數字進行三維建模;步驟S2:合成訓練圖片,工具軟件讀取步驟S1中的3D模型、材質及背景信息,并對3D模型、材質及背景進行模擬相機拍攝,得到不同的距離、角度、時段、場景下的拍攝照片;最后通過對所模擬得到的照片和物體材質進行不同組合,合成訓練圖片并輸出,在輸出時記錄當前狀態下各關注對象的模型空間位置;步驟S3:創建物體標注文件,根據步驟S3記錄的各關注對象的模型空間位置信息進行標注生成標注文件;步驟S4:保存標注文件,本發明能快速、高質量生成訓練素材及標注文件。
技術領域
本發明涉及自動創建人工智能圖像識別訓練素材與標注文件的方法,屬于人工智能技術領域。
背景技術
人工智能平臺軟件已經較為成熟,可以通過對大量訓練素材(經過預先標注的圖片)進行自動學習,形成特定的圖片識別模型。然后應用此模型,即可識別新的圖片中是否有關注的對象,并描述出該對象在圖片中的準確位置。但目前訓練素材的獲取存在如下困難:
拍攝困難。現有的訓練照片數據通常是通過人工拍攝或航拍方式采集獲取。受到安全、距離、角度、拍攝器材、時間、氣候等方面的各種制約,因而形成訓練圖片數量較少,難以形成人工智能需要的足夠信息量訓練照片。平均下來,每獲得100張符合要求的拍攝照片,從啟動計劃到最終提交,至少需要48小時以上。
標注困難。獲取到拍攝階段提供的訓練照片后,還必須要人工利用特定工具軟件進行標注處理,準確說明每個關注對象在圖片中的具體位置,并確定形成對應的標注文件。這樣,人工智能才能進行學習訓練,知道應該關注的有哪些對象,這些對象在圖片的什么區域。這一工作主要由人工完成,費時費力,效率低,速度慢,容易出現遺漏和偏差,且難以檢查。例如,假定一張1024*768分辨率圖片,圖片中有5個關注對象。從打開1張圖片,到手工畫框標注特定的5個對象,并完成標注檢查,熟練工人完成這一過程,平均需要約45秒。
總體質量低。在拍攝階段,很難準確拍攝出符合預期的海量照片,因此總體圖片數量偏少,時間長。標注階段主要依賴人工,而受生理因素限制,人工連續標注多張圖片后,其標注速度、準確度將迅速下降,從而影響訓練最終產生的訓練圖片數據集的總體質量也隨之下降。
即:現需要一種自動創建人工智能圖像識別訓練素材與標注文件的方法能解決上述問題。
發明內容
本發明要解決的技術問題是提供自動創建人工智能圖像識別訓練素材與標注文件的方法,可以克服現有技術的不足。
本發明的技術方案是:自動創建人工智能圖像識別訓練素材與標注文件的方法,該方法包括以下步驟:
步驟S1: 3D模型與場景設計,利用CAD類軟件數字進行三維建模,再采用3D MAX類軟件進行材質制作與背景渲染,并將模型、材質及背景信息獨立存放,以便組合使用;
步驟S2: 合成訓練圖片,工具軟件讀取步驟S1中的3D模型、材質及背景信息,并對3D模型、材質及背景進行模擬相機拍攝,得到不同的距離、角度、時段、場景下的拍攝照片;最后通過對所模擬得到的照片和物體材質進行不同組合,合成訓練圖片并輸出,在輸出時記錄當前狀態下各關注對象的模型空間位置;
步驟S3: 創建物體標注文件,根據步驟S3記錄的各關注對象的模型空間位置信息進行標注生成標注文件,所述的標注文件包含的信息包括圖片所屬、位置信息、每個對象及其二維平面坐標值;
步驟S4:保存標注文件。
上述步驟1中包含三維建模模塊和材質制作模塊及渲染模塊。
上述步驟S1中,在建模時,首先對重要的零部件單獨建模,最后將各零部件統一裝配成整體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王海軍,未經王海軍許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810325982.X/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





