[發(fā)明專利]一種圖片數(shù)據(jù)集獲得方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110983765.1 | 申請(qǐng)日: | 2021-08-25 |
| 公開(kāi)(公告)號(hào): | CN115730094A | 公開(kāi)(公告)日: | 2023-03-03 |
| 發(fā)明(設(shè)計(jì))人: | 許云中;王雄;郜振鋒 | 申請(qǐng)(專利權(quán))人: | 深信服科技股份有限公司 |
| 主分類號(hào): | G06F16/51 | 分類號(hào): | G06F16/51;G06F16/583;G06F16/58;G06F16/951;G06V10/22;G06V10/30;G06V10/762;G06V10/774 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 陳彥如 |
| 地址: | 518055 廣東省深圳市南*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖片 數(shù)據(jù) 獲得 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種圖片數(shù)據(jù)集獲得方法,其特征在于,包括:
根據(jù)接收到的圖片需求,確定核心關(guān)鍵詞;
生成所述核心關(guān)鍵詞的擴(kuò)展關(guān)鍵詞;
基于所述核心關(guān)鍵詞和所述擴(kuò)展關(guān)鍵詞,進(jìn)行主題圖片的爬取操作,獲得源圖片數(shù)據(jù)集;
對(duì)所述源圖片數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理,獲得目標(biāo)圖片數(shù)據(jù)集。
2.根據(jù)權(quán)利要求1所述的圖片數(shù)據(jù)集獲得方法,其特征在于,所述獲得源圖片數(shù)據(jù)集,包括:
對(duì)爬取到的圖片進(jìn)行去重和去噪處理后,獲得源圖片數(shù)據(jù)集。
3.根據(jù)權(quán)利要求1所述的圖片數(shù)據(jù)集獲得方法,其特征在于,所述生成所述核心關(guān)鍵詞的擴(kuò)展關(guān)鍵詞,包括:
通過(guò)預(yù)先訓(xùn)練獲得的擴(kuò)展模型,生成所述核心關(guān)鍵詞的擴(kuò)展關(guān)鍵詞。
4.根據(jù)權(quán)利要求1所述的圖片數(shù)據(jù)集獲得方法,其特征在于,所述對(duì)所述源圖片數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理,獲得目標(biāo)圖片數(shù)據(jù)集,包括:
對(duì)所述源圖片數(shù)據(jù)集中的圖片進(jìn)行學(xué)習(xí),基于學(xué)習(xí)到的特征,生成與所述源圖片數(shù)據(jù)集中的圖片具有相同主題的圖片;
基于所述源圖片數(shù)據(jù)集中的圖片和生成的與所述源圖片數(shù)據(jù)集中的圖片具有相同主題的圖片,確定目標(biāo)圖片數(shù)據(jù)集。
5.根據(jù)權(quán)利要求1所述的圖片數(shù)據(jù)集獲得方法,其特征在于,所述圖片需求為文字識(shí)別場(chǎng)景下的圖片需求,所述對(duì)所述源圖片數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理,獲得目標(biāo)圖片數(shù)據(jù)集,包括:
根據(jù)預(yù)先獲得的文本信息,生成包含所述文本信息的圖片;
基于所述源圖片數(shù)據(jù)集中的圖片和生成的包含所述文本信息的圖片,確定目標(biāo)圖片數(shù)據(jù)集。
6.根據(jù)權(quán)利要求5所述的圖片數(shù)據(jù)集獲得方法,其特征在于,生成的包含所述文本信息的圖片有多張,包含所述文本信息的每?jī)蓮垐D片中的文本字體、文本位置、背景中的至少一種不同。
7.根據(jù)權(quán)利要求1至6之中任一項(xiàng)所述的圖片數(shù)據(jù)集獲得方法,其特征在于,所述圖片需求為針對(duì)目標(biāo)模型訓(xùn)練的圖片需求,在所述獲得目標(biāo)圖片數(shù)據(jù)集之后,還包括:
利用所述目標(biāo)圖片數(shù)據(jù)集對(duì)所述目標(biāo)模型進(jìn)行訓(xùn)練優(yōu)化,以利用訓(xùn)練優(yōu)化后的所述目標(biāo)模型進(jìn)行任務(wù)處理;
獲得利用訓(xùn)練優(yōu)化后的所述目標(biāo)模型進(jìn)行任務(wù)處理的過(guò)程中的輸入圖片及相應(yīng)的處理結(jié)果;
基于獲得的所述輸入圖片及相應(yīng)的處理結(jié)果,擴(kuò)充所述目標(biāo)圖片數(shù)據(jù)集,重復(fù)執(zhí)行所述利用所述目標(biāo)圖片數(shù)據(jù)集對(duì)所述目標(biāo)模型進(jìn)行訓(xùn)練優(yōu)化的步驟。
8.一種圖片數(shù)據(jù)集獲得裝置,其特征在于,包括:
核心關(guān)鍵詞確定模塊,用于根據(jù)接收到的圖片需求,確定核心關(guān)鍵詞;
擴(kuò)展關(guān)鍵詞生成模塊,用于生成所述核心關(guān)鍵詞的擴(kuò)展關(guān)鍵詞;
源圖片數(shù)據(jù)集獲得模塊,用于基于所述核心關(guān)鍵詞和所述擴(kuò)展關(guān)鍵詞,進(jìn)行主題圖片的爬取操作,獲得源圖片數(shù)據(jù)集;
目標(biāo)圖片數(shù)據(jù)集獲得模塊,用于對(duì)所述源圖片數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)處理,獲得目標(biāo)圖片數(shù)據(jù)集。
9.一種圖片數(shù)據(jù)集獲得設(shè)備,其特征在于,包括:
存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;
處理器,用于執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的圖片數(shù)據(jù)集獲得方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的圖片數(shù)據(jù)集獲得方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深信服科技股份有限公司,未經(jīng)深信服科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110983765.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





