[發(fā)明專利]樣本數(shù)據(jù)集的生成方法、裝置及電子設備在審
| 申請?zhí)枺?/td> | 202210148525.4 | 申請日: | 2022-02-17 |
| 公開(公告)號: | CN114529909A | 公開(公告)日: | 2022-05-24 |
| 發(fā)明(設計)人: | 黃聚;李煜林;王鵬;謝群義;欽夏孟;姚錕 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06K9/62;G06T3/00;G06T7/10;G06T11/60 |
| 代理公司: | 北京博浩百睿知識產(chǎn)權代理有限責任公司 11134 | 代理人: | 宮傳芝 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 數(shù)據(jù) 生成 方法 裝置 電子設備 | ||
1.一種樣本數(shù)據(jù)集的生成方法,包括:
獲取原始圖像,其中,所述原始圖像中至少包括文本區(qū)域;
對所述原始圖像進行色彩變換處理,得到至少一個第一圖像;
對所述至少一個第一圖像進行裁剪處理,得到多個第一子圖像;
對所述多個第一子圖像進行貼合處理,得到多個目標圖像;
基于所述多個目標圖像生成樣本數(shù)據(jù)集,其中,所述樣本數(shù)據(jù)集用于對預設模型進行訓練,所述預設模型至少用于識別待識別圖像中的文本區(qū)域。
2.根據(jù)權利要求1所述的方法,其中,對所述原始圖像進行色彩變換處理,得到至少一個第一圖像,包括:
從多個色彩變換處理方式中隨機確定目標處理方式;
基于所述目標處理方式對所述原始圖像進行色彩變換,得到所述至少一個第一圖像。
3.根據(jù)權利要求2所述的方法,其中,基于所述目標處理方式對所述原始圖像進行色彩變換,得到所述至少一個第一圖像,包括:
在所述目標處理方式為色彩擾動處理方式時,對所述原始圖像的顏色通道進行隨機增強,得到所述至少一個第一圖像,其中,所述顏色通道至少包括:亮度通道、飽和度通道。
4.根據(jù)權利要求2所述的方法,其中,基于所述目標處理方式對所述原始圖像進行色彩變換,得到所述至少一個第一圖像,包括:
在所述目標處理方式為噪聲添加方式時,從多個噪聲信號中隨機確定目標噪聲信號;
基于所述目標噪聲信號對所述原始圖像進行噪聲疊加處理,得到所述至少一個第一圖像。
5.根據(jù)權利要求2所述的方法,其中,基于所述目標處理方式對所述原始圖像進行色彩變換,得到所述至少一個第一圖像,包括:
在所述目標處理方式為灰度處理方式時,將所述原始圖像轉換為灰度圖像,得到所述至少一個第一圖像。
6.根據(jù)權利要求1所述的方法,其中,對所述至少一個第一圖像進行裁剪處理,得到多個第一子圖像,包括:
確定所述至少一個第一圖像中的每個第一圖像所對應的裁剪數(shù)量,其中,所述裁剪數(shù)量表征對所述每個第一圖像進行裁剪所得到的圖像數(shù)量;
基于所述裁剪數(shù)量將所述每個第一圖像裁剪為多個圖像,得到所述多個第一子圖像。
7.根據(jù)權利要求6所述的方法,其中,基于所述裁剪數(shù)量將所述每個第一圖像裁剪為多個圖像,得到所述多個第一子圖像,包括:
檢測所述至少一個第一圖像中的目標文本區(qū)域;
基于所述裁剪數(shù)量以及所述目標文本區(qū)域對所述每個第一圖像進行裁剪,得到所述多個第一子圖像,其中,所述目標文本區(qū)域位于所述多個第一子圖像中的任意一個圖像中。
8.根據(jù)權利要求1所述的方法,其中,對所述多個第一子圖像進行貼合處理,得到多個目標圖像,包括:
從所述多個第一子圖像中確定組成每個目標圖像的至少一個第二圖像;
隨機確定所述至少一個第二圖像在對應的目標圖像上的圖像位置;
基于所述圖像位置對所述至少一個第二圖像進行貼合,得到所述多個目標圖像。
9.根據(jù)權利要求1所述的方法,其中,在對所述多個第一子圖像進行貼合處理,得到多個目標圖像之后,所述方法還包括:
對所述多個目標圖像進行幾何變換處理,得到多個第三圖像;
基于所述多個第三圖像構建所述樣本數(shù)據(jù)集。
10.根據(jù)權利要求9所述的方法,其中,所述方法還包括:
通過如下任意一種或多種方式對所述多個目標圖像進行幾何變換處理:
對所述多個目標圖像進行旋轉操作;
對所述多個目標圖像進行仿射變換操作;
對所述多個目標圖像進行透視變換操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210148525.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





