[發明專利]數據集的構建方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011462355.4 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112488033A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 汪賢;熊寶玉;樊鴻飛 | 申請(專利權)人: | 北京金山云網絡技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 盧萬騰;杜欣 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 構建 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例涉及一種數據集的構建方法、裝置、電子設備及存儲介質,包括:基于預設的多張原始圖像構建模擬數據集;基于所述模擬數據集從預設的多個候選特征算子集中確定目標特征算子集;基于所述目標特征算子集對候選數據集進行特征提取,得到候選數據特征集;利用預設的數據均衡策略對所述候選數據特征集進行均衡處理,并將均衡處理后的候選數據特征集中各候選數據特征對應的候選數據作為深度學習訓練數據,得到深度學習訓練數據集。由此,可以實現構建出具有均衡性的深度學習訓練數據集,進而也就可以提高利用深度學習訓練數據集訓練出的模型的泛化性和模型性能。
技術領域
本發明實施例涉及深度學習技術領域,尤其涉及一種數據集的構建方法、裝置、電子設備及存儲介質。
背景技術
在圖像信息技術被廣泛應用的情況下,對圖像質量的評估變成一個廣泛而基本的問題。比如,在圖像識別中,所采集到的圖像質量直接影響識別結果的準確性和可靠性;又如,在軍事應用方面,戰場監視和打擊評估的效果也取決于無人機等航拍設備所采集到的圖像或視頻的質量。因此,圖像質量的合理評估具有非常重要的應用價值。
隨著深度學習技術的不斷發展,深度學習技術被應用在圖像質量評估場景中,而在這一場景下,若訓練數據不均衡,那么訓練出來的圖像質量評價模型泛化能力較差且容易發生過擬合。因此,如何構建出具有均衡性的訓練數據集成為亟待解決的技術問題。
發明內容
鑒于此,為解決如何構建出具有均衡性的訓練數據集的技術問題,本發明實施例提供一種數據集的構建方法、裝置、電子設備及存儲介質。
第一方面,本發明實施例提供一種數據集的構建方法,所述方法包括:
基于預設的多張原始圖像構建模擬數據集;
基于所述模擬數據集從預設的多個候選特征算子集中確定目標特征算子集;
基于所述目標特征算子集對候選數據集進行特征提取,得到候選數據特征集;
利用預設的數據均衡策略對所述候選數據特征集進行均衡處理,并將均衡處理后的候選數據特征集中各候選數據特征對應的候選數據作為深度學習訓練數據,得到深度學習訓練數據集。
在一個可能的實施方式中,所述基于所述模擬數據集從預設的多個候選特征算子集中確定目標特征算子集,包括:
基于預設的多個候選特征算子集分別對所述模擬數據集進行特征提取,得到多個模擬數據特征集;
利用所述數據均衡策略分別對多個所述模擬數據特征集進行均衡處理,并將均衡處理后的模擬數據特征集中各模擬數據特征對應的模擬數據作為模擬訓練數據,得到多個模擬訓練數據集;
利用多個所述模擬訓練數據集分別對初始模型進行訓練,得到多個圖像質量評價模型;
確定多個所述圖像質量評價模型的性能指標值,以根據多個所述性能指標值從多個所述候選特征算子集中確定目標特征算子集。
在一個可能的實施方式中,所述確定多個所述圖像質量評價模型的性能指標值,包括:
將預設的測試數據分別輸入至多個所述圖像質量評價模型,得到多個所述圖像質量評價模型輸出的所述測試數據的預測質量指標值;
基于所述測試數據的真實質量指標值和預測質量指標值確定多個所述圖像質量評價模型的性能指標值。
在一個可能的實施方式中,所述根據多個所述性能指標值從多個所述候選特征算子集中確定目標特征算子集,包括:
將性能指標值最高的圖像質量評價模型對應的候選特征算子集確定為目標特征算子集。
在一個可能的實施方式中,所述基于預設的多張原始圖像構建模擬數據集,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山云網絡技術有限公司,未經北京金山云網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011462355.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多功能刷
- 下一篇:一種智能化物聯網醫療健康預警系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





