[發(fā)明專利]訓練圖片合成模型的方法及裝置有效

申請?zhí)枺?/td>	201811636004.3	申請日：	2018-12-29
公開（公告）號：	CN109726760B	公開（公告）日：	2021-04-16
發(fā)明（設(shè)計）人：	于海泳	申請（專利權(quán)）人：	馭勢科技（北京）有限公司
主分類號：	G06K9/62	分類號：	G06K9/62;G06T5/50;G06T9/00;G06T17/00
代理公司：	北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 11112	代理人：	彭瑞欣;劉悅晗
地址：	102402 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	訓練圖片合成模型方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了訓練圖片合成模型的方法及裝置，在該方案中，根據(jù)模擬圖片和相應(yīng)的真實圖片來訓練圖片合成模型，直至圖片合成模型收斂，由于收斂的圖片合成模型合成的圖片與真實圖片的相似度較高，這樣，可以采用收斂的圖片合成模型合成的圖片作為深度學習方法中需要用到的訓練樣本，就不需要實際采集訓練樣本，因此，可以提高訓練效率，另一方面還能合成不同場景下的圖片，因此，也可以解決特殊場景下人工采集圖片難度較大的問題。

技術(shù)領(lǐng)域

本發(fā)明涉及深度學習技術(shù)領(lǐng)域，特別涉及訓練圖片合成模型的方法及裝置。

背景技術(shù)

隨著科學技術(shù)的發(fā)展和社會的進步，人工智能技術(shù)的應(yīng)用越來越廣泛，如自動駕駛領(lǐng)域、機器人領(lǐng)域和安防領(lǐng)域都采用了人工智能技術(shù)。目標檢測和識別、目標跟蹤、場景語義分析等計算機視覺感知技術(shù)是人工智能技術(shù)中的關(guān)鍵部分，目前主要通過深度學習方法來提升計算機視覺感知技術(shù)的性能。

深度學習方法中需要用到大量的訓練樣本(幾十萬、上百萬甚至更多的圖片)來訓練網(wǎng)絡(luò)模型，如果訓練樣本都是人工實際采集的話，存在耗時較長的缺陷，對于有些特殊場景還存在難度較大的問題。

因此，如何生成逼真的圖片顯得尤為重要。

發(fā)明內(nèi)容

本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一，提出了訓練圖片合成模型的方法及裝置。

為實現(xiàn)上述目的，第一方面，本發(fā)明實施例提供了一種訓練圖片合成模型的方法，包括：

將第一組圖片和第二組圖片輸入圖片合成模型，利用所述圖片合成模型分別從所述第一組圖片和所述第二組圖片中提取表示相同物理含義的抽象特征，并根據(jù)提取得到的抽象特征對所述第一組圖片或所述第二組圖片進行處理，得到合成圖片；所述第一組圖片為模擬圖片，所述第二組圖片為與所述第一組圖片相對應(yīng)的真實圖片；

若所述合成圖片是第三組圖片，所述第三組圖片是對所述第一組圖片處理得到的，則將所述合成圖片與所述第二組圖片中的任意一張圖片進行比較；若所述合成圖片是第四組圖片，所述第四組圖片是對所述第二組圖片處理得到的，則將所述合成圖片與所述第一組圖片中的任意一張圖片進行比較；

根據(jù)比較結(jié)果判斷所述圖片合成模型是否收斂，若所述圖片合成模型收斂，則停止訓練所述圖片合成模型。

優(yōu)選地，利用所述圖片合成模型分別從所述第一組圖片和所述第二組圖片中提取表示相同物理含義的抽象特征，包括：

對所述第一組圖片和所述第二組圖片分別解碼得到第一組數(shù)據(jù)和第二組數(shù)據(jù)；

從所述第一組數(shù)據(jù)和所述第二組數(shù)據(jù)中分別提取表示相同物理含義的抽象特征。

優(yōu)選地，根據(jù)提取得到的抽象特征對所述第一組圖片或所述第二組圖片進行處理，得到合成圖片，包括：

將分別提取得到的抽象特征采用相同物理參數(shù)表征；

將所述相同物理參數(shù)替換所述第一組數(shù)據(jù)中表示該抽象特征的參數(shù)，并對替換后的第一組數(shù)據(jù)編碼，得到合成圖片；或

將所述相同物理參數(shù)替換所述第二組數(shù)據(jù)中表示該抽象特征的參數(shù)，并對替換后的第二組數(shù)據(jù)編碼，得到合成圖片。

優(yōu)選地，所述第一組圖片采用如下方式得到：

利用仿真物理引擎，建立三維模型；

在所述仿真物理引擎中設(shè)置虛擬相機；

采用所述虛擬相機拍攝所述三維模型，得到所述第一組圖片。

優(yōu)選地，采用所述虛擬相機拍攝所述三維模型，得到所述第一組圖片，包括：

采用所述虛擬相機基于光線追蹤技術(shù)拍攝所述三維模型，得到所述第一組圖片。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于馭勢科技（北京）有限公司，未經(jīng)馭勢科技（北京）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811636004.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預處理，即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】