[發(fā)明專利]生成人像圖像的方法、裝置、可讀介質(zhì)和電子設(shè)備在審
| 申請?zhí)枺?/td> | 202011402320.1 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112418139A | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計(jì))人: | 殷書寶;葉芳 | 申請(專利權(quán))人: | 上海依圖網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海華誠知識產(chǎn)權(quán)代理有限公司 31300 | 代理人: | 徐穎聰 |
| 地址: | 200051 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 生成 人像 圖像 方法 裝置 可讀 介質(zhì) 電子設(shè)備 | ||
本申請公開了一種生成人像圖像的方法、裝置、可讀介質(zhì)和電子設(shè)備,應(yīng)用于圖像生成領(lǐng)域。通過控制輸入到生成器的網(wǎng)絡(luò)單元中的目標(biāo)噪聲向量,使得生成的人像圖像庫特征質(zhì)量合格、豐富度足夠泛化、數(shù)量足夠充足。具體的,該方法包括:獲取多個(gè)隨機(jī)噪聲向量;對多個(gè)隨機(jī)噪聲向量進(jìn)行非線性變換得到多個(gè)目標(biāo)噪聲向量,多個(gè)隨機(jī)噪聲向量與多個(gè)目標(biāo)噪聲向量一一對應(yīng);根據(jù)多個(gè)目標(biāo)噪聲向量,得到多組向量序列,其中每組向量序列中包含的目標(biāo)噪聲向量的數(shù)量均為n,且不同向量序列中包含的目標(biāo)噪聲向量不同,n為大于或等于2的正整數(shù);基于多組向量序列生成多個(gè)人像圖像,多組向量序列與多個(gè)人像圖像一一對應(yīng)。具體的,該方法應(yīng)用于生成人像圖像的場景中。
技術(shù)領(lǐng)域
本申請涉及圖像生成領(lǐng)域,特別涉及一種生成人像圖像的方法、裝置、可讀介質(zhì)和電子設(shè)備。
背景技術(shù)
隨著人臉識別技術(shù)在安防,金融等領(lǐng)域大量落地應(yīng)用,對人臉識別技術(shù)相關(guān)的產(chǎn)品的質(zhì)量要求也隨之變高。通常以產(chǎn)品使用的人臉識別模型支持的精度以及底庫(即人像數(shù)據(jù)庫)規(guī)模作為衡量產(chǎn)品質(zhì)量的重要指標(biāo)。例如,在人臉識別模型中使用人像聚檔技術(shù),有利于提高人像識別的精度,以及提升人像庫規(guī)模。其中,人像聚檔指利用人臉識別模型對數(shù)據(jù)庫中人像根據(jù)特征相似度計(jì)算得到同一人的不同照片,并歸入一個(gè)檔案。
具體的,實(shí)際產(chǎn)品通常需要支持大規(guī)模人像庫聚檔,而發(fā)布支持大規(guī)模人像庫聚檔的模型需要更大規(guī)模的人像庫進(jìn)行質(zhì)量測試驗(yàn)收。然而,人臉數(shù)據(jù)因涉及個(gè)人隱私而被政府保護(hù),從而獲取困難、資源稀缺且無法形成市場,進(jìn)而導(dǎo)致規(guī)模較大的人像庫難以獲取。如果考慮偽造虛擬人臉用于人像聚檔對應(yīng)模型的測試,那么由于采用像素融合、區(qū)域裁切替等圖像處理領(lǐng)域的通用技術(shù)偽造虛擬人臉時(shí)無法形成新的人臉特征,將導(dǎo)致生成的虛擬人臉無法用于人像聚檔驗(yàn)證。
如此,如何獲取規(guī)模足夠大的人像數(shù)據(jù)庫,尤其是人像特征質(zhì)量合格、豐富度足夠泛化、數(shù)量足夠充足的人像數(shù)據(jù)庫,成為保障大規(guī)模聚檔模型算法的質(zhì)量面臨的難題。
發(fā)明內(nèi)容
本申請的一些實(shí)施例提供了一種生成人像圖像的方法、裝置、可讀介質(zhì)和電子設(shè)備,以下從多個(gè)方面介紹本申請,以下多個(gè)方面的實(shí)施方式和有益效果可互相參考。
第一方面,本申請的實(shí)施方式提供了一種生成人像圖像的方法,該方法包括:獲取多個(gè)隨機(jī)噪聲向量;對該多個(gè)隨機(jī)噪聲向量進(jìn)行非線性變換得到多個(gè)目標(biāo)噪聲向量,其中該多個(gè)隨機(jī)噪聲向量與該多個(gè)目標(biāo)噪聲向量一一對應(yīng);根據(jù)該多個(gè)目標(biāo)噪聲向量,得到多組向量序列,其中每組向量序列中包含的目標(biāo)噪聲向量的數(shù)量均為n,且不同向量序列中包含的目標(biāo)噪聲向量不同,n為大于或等于2的正整數(shù);基于該多組向量序列生成多個(gè)人像圖像,該多組向量序列與多個(gè)人像圖像一一對應(yīng)。
根據(jù)本申請的實(shí)施方式,將隨機(jī)噪聲向量通過非線性變換得到多個(gè)目標(biāo)噪聲向量,并針對多個(gè)目標(biāo)噪聲向量進(jìn)行組合和排序,得到多組向量序列,基多組向量序列生成一一對應(yīng)的人像圖片,因?yàn)檩斎氲南蛄啃蛄胁煌矡o規(guī)律,使得生成的人像圖像之間的特征泛性增強(qiáng)。
在一些實(shí)施方式中,上述生成人像圖像的方法是基于生成網(wǎng)絡(luò)實(shí)現(xiàn),該生成網(wǎng)絡(luò)包括串聯(lián)的n層神經(jīng)網(wǎng)絡(luò)單元,該n層神經(jīng)網(wǎng)絡(luò)單元中的前一層神經(jīng)網(wǎng)絡(luò)單元的輸出作為后一層神經(jīng)網(wǎng)絡(luò)單元的輸入;上述基于多組向量序列生成多個(gè)人像圖像,包括:將每組向量序列中的n個(gè)目標(biāo)噪聲向量按照排列順序依次輸入至n層神經(jīng)網(wǎng)絡(luò)單元中,并將預(yù)設(shè)向量輸入至n層神經(jīng)網(wǎng)絡(luò)單元中的第一層神經(jīng)網(wǎng)絡(luò)單元,使得n層神經(jīng)網(wǎng)絡(luò)單元中的最后一層神經(jīng)網(wǎng)絡(luò)單元輸出一個(gè)人像圖像,得到多個(gè)人像圖像。
在一些實(shí)施方式中,上述生成人像圖像的方法中:多個(gè)隨機(jī)噪聲向量和多個(gè)目標(biāo)噪聲向量中向量數(shù)量均為n,多組向量序列的組數(shù)和多個(gè)人像圖像的個(gè)數(shù)為n!,并且每組向量序列中均包含多個(gè)目標(biāo)噪聲向量中的所有目標(biāo)噪聲向量。
在一些實(shí)施方式中,上述生成人像圖像的方法中,多個(gè)隨機(jī)噪聲向量中每個(gè)隨機(jī)噪聲向量的數(shù)據(jù)結(jié)構(gòu)均為1×n維。
在一些實(shí)施方式中,上述生成人像圖像的方法中,生成網(wǎng)絡(luò)基于反卷積網(wǎng)絡(luò)實(shí)現(xiàn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海依圖網(wǎng)絡(luò)科技有限公司,未經(jīng)上海依圖網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011402320.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





