[發(fā)明專利]一種圖像數(shù)據(jù)增廣方法在審
| 申請?zhí)枺?/td> | 202310403244.3 | 申請日: | 2023-04-13 |
| 公開(公告)號: | CN116664969A | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計)人: | 張大飛 | 申請(專利權(quán))人: | 重慶銳明信息技術(shù)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V20/70;G06V10/82;G06N3/0475;G06N3/094 |
| 代理公司: | 重慶強(qiáng)大凱創(chuàng)專利代理事務(wù)所(普通合伙) 50217 | 代理人: | 趙玉乾 |
| 地址: | 400039 重慶市沙坪壩區(qū)科園*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 數(shù)據(jù) 增廣 方法 | ||
本發(fā)明屬于圖像數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種圖像數(shù)據(jù)增廣方法,包括首先采集標(biāo)準(zhǔn)場景下的圖像,并按照預(yù)設(shè)的場景標(biāo)簽進(jìn)行標(biāo)注,生成訓(xùn)練數(shù)據(jù)集以及獲取目標(biāo)數(shù)據(jù);然后根據(jù)訓(xùn)練數(shù)據(jù)集訓(xùn)練構(gòu)建生成對抗網(wǎng)絡(luò);最后將目標(biāo)數(shù)據(jù)、預(yù)設(shè)的場景標(biāo)簽取值范圍以及訓(xùn)練數(shù)據(jù)集中圖像對應(yīng)的場景標(biāo)簽個數(shù)輸入至生成對抗網(wǎng)絡(luò)中,并預(yù)設(shè)采樣范圍和預(yù)設(shè)采樣個數(shù)輸入至生成對抗網(wǎng)絡(luò),輸出增廣后的圖像數(shù)據(jù);所述生成對抗網(wǎng)絡(luò)包括生成器、判別器、場景映射網(wǎng)絡(luò)以及場景編碼器。本發(fā)明能夠解決現(xiàn)有技術(shù)中的針對采集的訓(xùn)練數(shù)據(jù)進(jìn)行的圖像增廣方法存在未考慮場景的不均衡,導(dǎo)致在部分場景下深度學(xué)習(xí)模型的精度降低的問題。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種圖像數(shù)據(jù)增廣方法。
背景技術(shù)
隨著人工智能的發(fā)展,深度學(xué)習(xí)模型已成為研究的熱門;深度學(xué)習(xí)模型廣泛應(yīng)用于語音識別和圖像識別等領(lǐng)域中,尤其是在圖像識別領(lǐng)域中,深度學(xué)習(xí)模型由多級提取抽象特征的學(xué)習(xí)處理層構(gòu)成,利用深度神經(jīng)網(wǎng)絡(luò)和傳播算法學(xué)習(xí)、處理和分析圖像特征,以達(dá)到識別各種不同模式的目標(biāo)和對象。
深度學(xué)習(xí)網(wǎng)絡(luò)為了獲得更好的泛化能力,需要大量高質(zhì)量的多樣化測試數(shù)據(jù),在實(shí)際收集大量測試數(shù)據(jù)時,尤其是不同場景下的數(shù)據(jù),往往存在較大的困難,一方面是數(shù)據(jù)存在不足,采集成本高,另一方面是數(shù)據(jù)質(zhì)量較差,傳統(tǒng)的數(shù)據(jù)處理方式包括旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪以及集成到訓(xùn)練框架中進(jìn)行處理,但傳統(tǒng)的處理方式仍然不能獲得大量高質(zhì)量的數(shù)據(jù),為此,現(xiàn)有技術(shù)中的圖像數(shù)據(jù)增廣方法,假定圖像噪聲服從正態(tài)分布,通過生成器利用三個層級的特征圖像,分別為特征圖、先驗約束和約束特征向量,并進(jìn)行通道拼接,先驗約束采用正態(tài)分布的隨機(jī)噪聲,但實(shí)際上噪聲的分布往往是高斯分布和泊松噪聲等多種噪聲的融合,因此數(shù)據(jù)集只限于已標(biāo)定的,生成的數(shù)據(jù)存在場景不均衡的問題。
發(fā)明內(nèi)容
本發(fā)明所解決的技術(shù)問題在于提供一種圖像數(shù)據(jù)增廣方法,以解決現(xiàn)有技術(shù)中的針對采集的訓(xùn)練數(shù)據(jù)進(jìn)行的圖像增廣方法存在未考慮場景的不均衡,導(dǎo)致在部分場景下深度學(xué)習(xí)模型的精度降低的問題。
本發(fā)明提供的基礎(chǔ)方案:一種圖像數(shù)據(jù)增廣方法,包括:
S1:采集標(biāo)準(zhǔn)場景下的圖像,并按照預(yù)設(shè)的場景標(biāo)簽進(jìn)行標(biāo)注,生成訓(xùn)練數(shù)據(jù)集一,并獲取用于目標(biāo)檢測的目標(biāo)數(shù)據(jù);
S2:基于訓(xùn)練數(shù)據(jù)集一,訓(xùn)練建立多場景融合參數(shù)融合的生成對抗網(wǎng)絡(luò);所述生成對抗網(wǎng)絡(luò)包括生成器、判別器、場景映射網(wǎng)絡(luò)以及場景編碼器;
S3:將目標(biāo)數(shù)據(jù)、預(yù)設(shè)的場景標(biāo)簽取值范圍以及目標(biāo)數(shù)據(jù)中圖像對應(yīng)的場景標(biāo)簽個數(shù)輸入至生成對抗網(wǎng)絡(luò)中,并預(yù)設(shè)采樣范圍和預(yù)設(shè)采樣個數(shù)輸入至生成對抗網(wǎng)絡(luò),輸出增廣后的圖像數(shù)據(jù)。
進(jìn)一步,所述S1中預(yù)設(shè)的場景標(biāo)簽包括色溫參數(shù)、亮度參數(shù)和運(yùn)動模糊度參數(shù)。
進(jìn)一步,所述S2中包括:
S2-1:將色溫參數(shù)、亮度參數(shù)取對數(shù)后,和運(yùn)動模糊度參數(shù)按照預(yù)設(shè)采樣范圍和預(yù)設(shè)采樣個數(shù)經(jīng)采樣后組成掩碼向量,并和圖像一同輸入映射網(wǎng)絡(luò)中映射出風(fēng)格碼;
S2-2:通過場景編碼器從映射網(wǎng)絡(luò)中提取風(fēng)格碼。
進(jìn)一步,所述S3包括:
S3-1:將風(fēng)格碼和目標(biāo)數(shù)據(jù)中的圖像通過生成器得到輸出圖像;
S3-2:采用判別器,通過損失函數(shù)計算生成器的損失值,根據(jù)損失值調(diào)整對應(yīng)的網(wǎng)絡(luò)參數(shù),直至得到收斂的生成對抗網(wǎng)絡(luò)。
進(jìn)一步,所述S3-2中的損失函數(shù)包括對抗損失和風(fēng)格多樣損失,所述對抗損失的計算方式如下:
其中,x表示圖像,m表示掩碼向量;
所述風(fēng)格多樣損失計算公式如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶銳明信息技術(shù)有限公司,未經(jīng)重慶銳明信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310403244.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種抽拉式鍵盤托架增廣裝置
- 數(shù)據(jù)增廣參數(shù)的調(diào)整方法、裝置、設(shè)備及存儲介質(zhì)
- 一種文本增廣處理方法、裝置及存儲介質(zhì)
- 一種數(shù)據(jù)增廣方法及電子設(shè)備
- 基于人工智能的圖像分類模型訓(xùn)練方法、分類方法及裝置
- 數(shù)據(jù)增廣的方法、裝置及電子設(shè)備
- 圖像增廣方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)增廣、業(yè)務(wù)處理方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 一種模型訓(xùn)練方法及裝置
- 模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)





